Petits fichiers : match-codez à la main !
Lorsque vous cherchez à dédoublonner un petit fichier (moins de 3 000 adresses), vous pouvez aussi bien le réaliser par vous-même avec les outils dont vous disposez. Un tableur ou un système de gestion de base de données suffisent largement. Outre l'économie qui en résulte, créer une "moulinette" bureautique vous apporte souplesse et rapidité. Mais comment allez-vous vous y prendre ?
1 Vos adresses présentent une hétérogénéité de saisie : les numéros des voies sont suivis une fois sur deux d'une virgule ; leurs intitulés comportent aléatoirement des traits d'union ou pas ; de nombreux espaces doubles en séparent les mots... De quelles fonctions et formules disposez-vous dans un logiciel bureautique comme Excel, par exemple, pour épurer votre fichier ?
À LIRE AUSSI
- Comment traiter ses adresses postales
- Les opérations incontournables du traitement des adresses
- Opinions
- Opinions
- Opinions
- Opinions
- Opinions
- Opinions
- Opinions
- La Poste lance une nouvelle offre
- Veillez aux obligations légales
- BMW opte pour la solution progiciel
- Quelques pratiques de bon sens à suivre
- Les conséquences du e-commerce
- OBIMD commercialise Code-1 Plus International
- Petits fichiers : match-codez à la main !
RÉPONSE : L'incontournable Remplacer du menu Edition
vous offre un grand nombre de possibilités : remplacer les traits d'union par
des espaces (ou l'inverse) et les espaces doubles par des espaces simples,
éliminer les virgules, etc. Créez une macro-commande très simplement, en
enregistrant ces différentes manoeuvres grâce à Outils/Macro/Nouvelle macro.
2 Sur la plupart des systèmes de gestion de bases de données (SGBD), comme Access, Approach, 4D, Paradox..., il vous est possible de demander qu'une rubrique - le NOM, par exemple - soit considérée "unique". En d'autres termes, votre fichier ne pourra alors contenir deux prospects portant le même patronyme. Mais cette technique est par trop limitative. Sur quelles bases pouvez-vous construire un match-code facile à mettre en oeuvre dans le contexte d'un petit fichier, et adapté aux compétences restreintes d'un tableur ou d'un SGBD bureautique ?
RÉPONSE : Lorsque vous demandez à votre
ordinateur de comparer vos adresses entre elles, il suffit d'une toute petite
variation de saisie entre les deux adresses d'un doublon, pour que le logiciel
ne s'aperçoive de rien : ETEICOS S.A. ETEICOS S.A. 4 rue Victor Hugo 4 rue
Victor-Hugo 45000 Orléans 45000 Orléans Pour l'ordinateur, ces deux adresses
sont différentes, si vous lui demandez de vérifier point par point leur
identité : le trait d'union de la seconde joue ici le rôle du grain de sable.
Tout comme l'aurait fait un "V." à la place de Victor, une virgule après le
"4", un "boulevard" remplaçant "rue", etc. Comment faire alors ? Tout
simplement conserver, avant d'effectuer la comparaison, les éléments les moins
susceptibles de varier d'une saisie à l'autre. Dans notre exemple, vous
retiendrez les trois premières lettres du nom de la société, le numéro de la
rue, les trois premières lettres du dernier mot du nom de la rue, le numéro du
département et les trois premières lettres du nom de la ville : ETEICOS S.A. 4
rue Victor Hugo 45000 Orléans La clef correspondante - le match-code - est :
ETE4HUG45ORL. Elle est calculée instantanément par l'ordinateur, qui n'a plus
qu'à la comparer avec celles des autres prospects pour vérifier si un doublon
existe. Programmable dans tout bon SGBD bureautique, le "match-codage" varie
d'un type d'adresse à l'autre, pour tenir compte des particularismes (CEDEX,
zones d'activité etc.).
3 Une fois la structure de votre match-code déterminée en fonction de vos propres spécificités, comment allez-vous le mettre en oeuvre ?
RÉPONSE : L'outil le mieux adapté est le SGBD.
Mais il n'est pas le plus simple. Tout le monde ne connaît pas sur le bout des
doigts Access, par exemple, alors qu'un tableur comme Excel ou Lotus 1.2.3 a
fait, bien souvent, l'objet d'une formation dans votre société. Or, notre
démarche consiste ici à faire vite, simple et bien. Il suffit donc de connaître
quelques formules disponibles sur un tableur pour mener à bien cette tâche. Les
voici (nous avons choisi Excel du fait qu'il soit très répandu ; les formules
équivalentes existent chez les concurrents de ce logiciel) : - CONCATENER
(texte1;texte2; texte3...) : assemble plusieurs chaînes de caractères de façon
à n'en former qu'une. Cette fonction vous permet de "coller" les différentes
parties du match-code entre elles pour former ce dernier. "texte1", "texte2",
"texte3..." sont en fait le résultat des fonctions GAUCHE et DROITE suivantes :
GAUCHE (coordonnées d'une cellule contenant du texte ; nombre de lettres à
extraire du texte) : extrait les derniers caractères à la gauche d'un texte.
Par exemple, si la cellule A8 de votre feuille de calcul contient le nom de la
société, "ETEICOS", GAUCHE(A8;3) extrait et affiche les trois premières lettres
: "ETE" ; DROITE (coordonnées d'une cellule contenant du texte ; nombre de
lettres à extraire du texte) : la même chose... mais à partir de la droite du
contenu de la cellule ("COS", selon notre exemple). - TEXTE (coordonnées d'une
cellule contenant un nombre ; format) : convertit en texte le nombre contenu
par la cellule. Imaginons que vos match-codes soient dans la colonne G de votre
feuille de calcul, ce qui revient à dire qu'une formule commençant par
CONCATENER(GAUCHE(A... ; 3);... se trouve dans chaque cellule de cette colonne.
Il convient maintenant de les comparer. Commencez par les trier : sélectionnez
la colonne, puis utilisez Données/Trier ("étendre la sélection")/Trier par
colonne : G (croissant/ligne de titre : NON). Dans la cellule située à droite
de chaque match-code, incorporez une formule de comparaison. Vous avez deux
possibilités : la plus simple, EXACT (G8 ; G7), par exemple. Placée en H8,
cette formule compare le match-code situé à gauche (G8) avec celui qui le
précède dans la colonne (G7). "FAUX" s'affiche s'il y a des variations de l'un
à l'autre ; "VRAI" si les deux sont parfaitement identiques. Moins simple mais
plus lisible quant au résultat : SI(G8=G7;"doublon ?";" "). Cette fois,
"doublon ?" s'affiche lorsque les deux match-codes sont identiques, sinon rien
n'apparaît dans la cellule, ce qui facilite le repérage visuel. Il ne vous
reste plus alors qu'à vérifier "à la main", au cas par cas, s'il s'agit bien de
doublons et, dans l'affirmative, à supprimer l'une des deux lignes
incriminées...