Recherche

Recruter ou fidéliser : le travail sur les fichiers sera différent

De la normalisation jusqu'à la déduplication, les prestataires proposent l'ensemble des opérations d'entretien et les complètent parfois avec des enrichissements grâce à d'autres sources marketing.

Publié par le
Lecture
9 min
  • Imprimer


Une opération de mailing est généralement précédée par une action d'entretien des fichiers. Le but est d'éliminer à l'avance toutes les adresses qui ne pourront pas être atteintes, soit parce que le destinataire a déménagé, ne souhaite plus recevoir les informations... ou parce que l'adresse elle-même n'existe pas ! Autant de retours "N'habite pas à l'adresse indiquée" à éviter pour augmenter l'efficacité et alléger les coûts de l'opération. « Envoyer un mailing coûte un euro, valider l'adresse avant l'envoi coûte dix fois moins », remarque Eric Dhaussy, directeur général d'Altria. Ce calcul sert de justification économique à une série de traitements assez complexes, mobilisant une puissance informatique. « L'entretien des fichiers avant une opération de mailing est différent selon qu'il s'agit de la prospection ou de la fidélisation », explique Henry Journée, directeur général de BCA, spécialiste d'analyse statistique et d'entretien des fichiers. Quand il s'agit du recrutement, son entreprise reçoit des fichiers des sources diverses, parfois plus de 200 fichiers pour la même campagne et dont la taille varie entre 5 000 et 100 000 adresses. Certains propriétaires de fichiers comme les Trois Suisses demandent même à inspecter ses locaux avant de donner l'autorisation d'utilisation, pour être certains que leurs fichiers seront en sécurité.

Normalisation des adresses


Dans les opérations de fidélisation, la logique est naturellement différente de la prospection. Ici, il s'agit d'enrichir le fichier des clients de l'entreprise avec des informations provenant des bases de comportement. La correction des fichiers est un travail rigoureux qui exige aussi un traitement manuel à l'écran, ce qui augmente les dépenses. « Les coûts de traitement des fichiers pour une opération de fidélisation sont en moyenne quatre fois supérieurs à ceux d'une action de recrutement », estime Henry Journée. Le premier stade du traitement consiste à normaliser et à restructurer les adresses. « C'est une opération complètement automatisée. Dès lors qu'il s'agit de traiter des volumes de 20 000 adresses et plus, il n'est pas question d'une intervention manuelle », remarque Mohamed Messaoudi, responsable du département traitement informatique des adresses au sein de l'agence ETO. Pour lui, la normalisation postale est intéressante sur plusieurs plans. D'abord esthétique, avec la possibilité d'envoyer des mailings de qualité avec des adresses libellées sans faute d'orthographe. « Cela fait crédible quand on est supposé écrire à des clients que l'on connaît bien », observe Mohamed Messaoudi. Quelqu'un qui reçoit un courrier adressé à "Mlle Jean Dupont", a l'impression d'être complètement impersonnel dans un lot. La normalisation ouvre la voie à la personnalisation. Quand le nom, le prénom et la civilité se trouvent ensemble dans un seul champ du fichier à la place de trois, la personnalisation est alors difficile. Il faut identifier ces trois éléments et les placer dans trois cases dans l'ordre. La normalisation assure le respect des normes postales, indispensable pour bénéficier des tarifs préférentiels de La Poste grâce à l'utilisation de la lecture optique dans le traitement automatique de l'adresse. En cas de rejet, le courrier passe au traitement manuel et, lorsque le taux de rejet dépasse le seuil, l'envoyeur peut se voir infliger un redressement postal d'environ 0,03 euro par envoi, sur la totalité du lot et non seulement sur les courriers rejetés.

La nécessaire coopération des propriétaires des fichiers


« Nous commençons par uniformiser l'adresse, souvent sur une ou deux centaines de fichiers », explique Haï Le Mong, gérant de la société Uniservices Informatique, prestataire qui traite 300 millions d'adresses par an. A ce moment, le but est d'isoler la civilité, le nom et le prénom pour obtenir à la sortie un format unique. Une opération qui ne peut pas se faire sans la coopération des propriétaires des fichiers. Ils doivent, par exemple, indiquer au préalable leur règle de structuration, nom-prénom ou prénom-nom, afin d'éviter à l'ordinateur de plancher sur l'éternel problème de Jacques Martin versus Martin Jacques. Au stade suivant, le logiciel détecte les mots-clés comme le nom de la résidence ou le numéro de l'appartement et remet ces données à leur place. Ensuite il s'occupera de l'adresse elle-même, de ses trois dernières lignes, faisant appel aux référentiels Hexavia et d'autres. D'abord la validation postale, l'existence du code localité. La voie est-elle reconnue ? Le logiciel accepte les fautes d'orthographe possibles provenant de la saisie ou encore de l'écriture mnémonique, par exemple quand l'adresse est dictée au téléphone. Lors d'un conflit entre le code postal et le nom de la localité, c'est le nom qui l'emporte. A la fin, il est aussi possible d'affecter les codes Insee des communes ou encore renseigner les tournées du facteur. Tous les gestionnaires des fichiers ont des logiques internes différentes et emploient des formats différents, ce qui ne facilite pas l'entretien. Et le nouveau format préconisé par La Poste, ne s'est pas imposé partout. La plupart des vépécistes sont certes aux normes mais pas les petites structures ni les nouveaux arrivants sur le marché. Chez ces derniers on voit nombre de fautes dans les adresses provenant de la saisie manuelle. Lors de la normalisation on accepte quelques rejets, là où les machines n'ont pas pu trouver un équivalent probable. Un taux de rejet à 4 ou 5 % est considéré comme acceptable, mais il peut atteindre 15 % et plus sur des fichiers dont la saisie a été réalisée à l'étranger.

De la normalisation au "nettoyage"


A partir du moment où les adresses ont été normalisées, on peut passer au "nettoyage" du fichier. C'est le traitement par anticipation des NPAI, grâce à la base nationale des changements d'adresses. A ce moment, on compare aussi les listes d'adresses avec le fichier de référence Estocade, de La Poste, qui contient les adresses non-existantes suite à un déménagement. A raison de deux millions de changements d'adresses par an en France, cela représente quand même près de 10 % des ménages. Cette étape est particulièrement importante lorsqu'il s'agit d'effectuer une relance commerciale sur les clients inactifs de plus de vingt-quatre mois. Le filtrage avec le référentiel de La Poste permet d'éliminer plus de 15 % des adresses inexistantes avant l'opération. Pour ces clients qui ont déménagé, on peut aussi faire appel aux fichiers des changements d'adresses Charade, pour connaître leur nouvelle adresse - encore que cette opération ne peut pas être réalisée directement par le prestataire car La Poste ne diffuse pas ce fichier à l'extérieur de ses murs. Pour faire oublier le côté plutôt unifié du "nettoyage" - tout le monde utilise un seul et même fichier de La Poste - les prestataires cherchent à proposer des offres plus personnelles. « Avec des outils développés en interne, nous arrivons à dépasser le cadre de normalisation et de restructuration habituelles, affirme Eric Dhaussy. Nous faisons aussi du nettoyage des fichiers, nous pouvons identifier grâce au fichier de France Télécom la présence de la personne à l'adresse correspondante, ce qui permet d'acquérir une certitude quant à ce destinataire. Et, pour les adresses où un doute subsiste, nous allons identifier les cas de déménagement et les renseigner avec les nouvelles adresses. » Cette démarche de survalidation permet d'améliorer la probabilité de toucher la cible sur le coeur du fichier. Le degré d'effort développé ici par le prestataire sera conditionné par la catégorie à laquelle appartiennent les adresses. Est-ce qu'il s'agit des bons clients de l'entreprise ou non ? Un client très actif représente une acquisition chère pour l'entreprise. On lui enverra le mailing même si un doute subsiste. Ou bien, si le client est porteur d'une carte de fidélité, on essaiera de valider son adresse lors du prochain passage en caisse. Parmi d'autres enrichissements possibles, on cite la segmentation suivant le type de commune, rurale, ouvrière, etc., l'habitat individuel ou collectif. La date d'emménagement peut être estimée à partir de la date d'ouverture de ligne par France Télécom. On peut réaliser une extrapolation du niveau social ou des comportements, par exemple, à partir des données Consodata.

Importance de la déduplication


Le dernier stade du traitement consiste à comparer les différents fichiers d'adresses entre eux pour éliminer les doublons. La déduplication génère une problématique touchant à la programmation et à l'intelligence artificielle. Car la difficulté ici est de « faire comprendre à l'ordinateur ce que l'oeil humain peut détecter », comme le remarque Eric Dhaussy. Pour cela on va affecter des clés de déduplication permettant de comparer les chaînes de caractères à l'intérieur de ces clés, avec des dictionnaires des références. Par exemple, pour M. Dupont habitant rue du Général de Gaulle, d'abord effectuer une validation postale, vérifier que la rue existe bien dans la localité, comparer avec toutes les variantes des écritures pour le code de la voie, le numéro dans la voie, le nom, le prénom. L'ensemble de ces algorithmes permet de retrouver les doublons probables. A partir de là, on va trier le fichier en deux groupes : celui des adresses uniques et celui des doublons possibles. La suite dépendra des règles de déduplication définies à l'avance par l'annonceur. Ces règles sont établies sur une échelle allant de "trop" à "pas assez". Dans le premier cas de figure, appelé aussi "overkill", on élimine jusqu'aux "faux doublons", par exemple plusieurs Jacques Durand habitant dans le même immeuble et dont on ne peut pas préciser lequel est déjà client de l'entreprise. L'objectif est d'éviter que les offres promotionnelles particulièrement alléchantes ne soient pas adressées à des personnes déjà clientes de l'annonceur. Dans le deuxième cas, dit "underkill", on gardera même les "vrais" doublons quitte à envoyer peut-être plusieurs courriers à la même personne. La puissance de l'informatique joue un rôle crucial dans la précision de la déduplication. Uniservices utilise à ce stade deux types de matériel, un gros ordinateur "mainframe" d'IBM et deux serveurs sous Windows NT. L'application de normalisation postale POST a été enrichie avec des couches logicielles développées par les informaticiens de l'entreprise. Haï Le Mong estime que « même si certains noms dits à risque, comme Durant - Durand, nous empêchent d'atteindre une fiabilité absolue, les méthodes que nous utilisons sont quand même fiables à 98 % ».

Alexis Nekrassov

S'abonner
au magazine
Se connecter
Retour haut de page