Recherche

Petits fichiers : match-codez à la main !

Lorsque vous cherchez à dédoublonner un petit fichier (moins de 3 000 adresses), vous pouvez aussi bien le réaliser par vous-même avec les outils dont vous disposez. Un tableur ou un système de gestion de base de données suffisent largement. Outre l'économie qui en résulte, créer une "moulinette" bureautique vous apporte souplesse et rapidité. Mais comment allez-vous vous y prendre ?

Publié par le
Lecture
6 min
  • Imprimer

1 Vos adresses présentent une hétérogénéité de saisie : les numéros des voies sont suivis une fois sur deux d'une virgule ; leurs intitulés comportent aléatoirement des traits d'union ou pas ; de nombreux espaces doubles en séparent les mots... De quelles fonctions et formules disposez-vous dans un logiciel bureautique comme Excel, par exemple, pour épurer votre fichier ?


RÉPONSE : L'incontournable Remplacer du menu Edition vous offre un grand nombre de possibilités : remplacer les traits d'union par des espaces (ou l'inverse) et les espaces doubles par des espaces simples, éliminer les virgules, etc. Créez une macro-commande très simplement, en enregistrant ces différentes manoeuvres grâce à Outils/Macro/Nouvelle macro.

2 Sur la plupart des systèmes de gestion de bases de données (SGBD), comme Access, Approach, 4D, Paradox..., il vous est possible de demander qu'une rubrique - le NOM, par exemple - soit considérée "unique". En d'autres termes, votre fichier ne pourra alors contenir deux prospects portant le même patronyme. Mais cette technique est par trop limitative. Sur quelles bases pouvez-vous construire un match-code facile à mettre en oeuvre dans le contexte d'un petit fichier, et adapté aux compétences restreintes d'un tableur ou d'un SGBD bureautique ?


RÉPONSE : Lorsque vous demandez à votre ordinateur de comparer vos adresses entre elles, il suffit d'une toute petite variation de saisie entre les deux adresses d'un doublon, pour que le logiciel ne s'aperçoive de rien : ETEICOS S.A. ETEICOS S.A. 4 rue Victor Hugo 4 rue Victor-Hugo 45000 Orléans 45000 Orléans Pour l'ordinateur, ces deux adresses sont différentes, si vous lui demandez de vérifier point par point leur identité : le trait d'union de la seconde joue ici le rôle du grain de sable. Tout comme l'aurait fait un "V." à la place de Victor, une virgule après le "4", un "boulevard" remplaçant "rue", etc. Comment faire alors ? Tout simplement conserver, avant d'effectuer la comparaison, les éléments les moins susceptibles de varier d'une saisie à l'autre. Dans notre exemple, vous retiendrez les trois premières lettres du nom de la société, le numéro de la rue, les trois premières lettres du dernier mot du nom de la rue, le numéro du département et les trois premières lettres du nom de la ville : ETEICOS S.A. 4 rue Victor Hugo 45000 Orléans La clef correspondante - le match-code - est : ETE4HUG45ORL. Elle est calculée instantanément par l'ordinateur, qui n'a plus qu'à la comparer avec celles des autres prospects pour vérifier si un doublon existe. Programmable dans tout bon SGBD bureautique, le "match-codage" varie d'un type d'adresse à l'autre, pour tenir compte des particularismes (CEDEX, zones d'activité etc.).

3 Une fois la structure de votre match-code déterminée en fonction de vos propres spécificités, comment allez-vous le mettre en oeuvre ?


RÉPONSE : L'outil le mieux adapté est le SGBD. Mais il n'est pas le plus simple. Tout le monde ne connaît pas sur le bout des doigts Access, par exemple, alors qu'un tableur comme Excel ou Lotus 1.2.3 a fait, bien souvent, l'objet d'une formation dans votre société. Or, notre démarche consiste ici à faire vite, simple et bien. Il suffit donc de connaître quelques formules disponibles sur un tableur pour mener à bien cette tâche. Les voici (nous avons choisi Excel du fait qu'il soit très répandu ; les formules équivalentes existent chez les concurrents de ce logiciel) : - CONCATENER (texte1;texte2; texte3...) : assemble plusieurs chaînes de caractères de façon à n'en former qu'une. Cette fonction vous permet de "coller" les différentes parties du match-code entre elles pour former ce dernier. "texte1", "texte2", "texte3..." sont en fait le résultat des fonctions GAUCHE et DROITE suivantes : GAUCHE (coordonnées d'une cellule contenant du texte ; nombre de lettres à extraire du texte) : extrait les derniers caractères à la gauche d'un texte. Par exemple, si la cellule A8 de votre feuille de calcul contient le nom de la société, "ETEICOS", GAUCHE(A8;3) extrait et affiche les trois premières lettres : "ETE" ; DROITE (coordonnées d'une cellule contenant du texte ; nombre de lettres à extraire du texte) : la même chose... mais à partir de la droite du contenu de la cellule ("COS", selon notre exemple). - TEXTE (coordonnées d'une cellule contenant un nombre ; format) : convertit en texte le nombre contenu par la cellule. Imaginons que vos match-codes soient dans la colonne G de votre feuille de calcul, ce qui revient à dire qu'une formule commençant par CONCATENER(GAUCHE(A... ; 3);... se trouve dans chaque cellule de cette colonne. Il convient maintenant de les comparer. Commencez par les trier : sélectionnez la colonne, puis utilisez Données/Trier ("étendre la sélection")/Trier par colonne : G (croissant/ligne de titre : NON). Dans la cellule située à droite de chaque match-code, incorporez une formule de comparaison. Vous avez deux possibilités : la plus simple, EXACT (G8 ; G7), par exemple. Placée en H8, cette formule compare le match-code situé à gauche (G8) avec celui qui le précède dans la colonne (G7). "FAUX" s'affiche s'il y a des variations de l'un à l'autre ; "VRAI" si les deux sont parfaitement identiques. Moins simple mais plus lisible quant au résultat : SI(G8=G7;"doublon ?";" "). Cette fois, "doublon ?" s'affiche lorsque les deux match-codes sont identiques, sinon rien n'apparaît dans la cellule, ce qui facilite le repérage visuel. Il ne vous reste plus alors qu'à vérifier "à la main", au cas par cas, s'il s'agit bien de doublons et, dans l'affirmative, à supprimer l'une des deux lignes incriminées...

Xavier Lucron

S'abonner
au magazine
Se connecter
Retour haut de page