Recruter ou fidéliser : le travail sur les fichiers sera différent
De la normalisation jusqu'à la déduplication, les prestataires proposent l'ensemble des opérations d'entretien et les complètent parfois avec des enrichissements grâce à d'autres sources marketing.
Je m'abonneÀ LIRE AUSSI
- Comment entretenir ses fichiers
- Les étapes incontournables pour un fichier de qualité
- La Poste, première source d'informations
- Un code de bonne conduite face aux fichiers
- Chez Nocibé, un nettoyage en profondeur du fichier
- Une évolution impossible ?
- Médecins du Monde : « Réduire les coûts, c'est mieux servir notre cause »
- Décuplez vos déduplications !
- Comment entretenir ses fichiers
- Les étapes incontournables pour un fichier de qualité
- La Poste, première source d'informations
- Un code de bonne conduite face aux fichiers
- Chez Nocibé, un nettoyage en profondeur du fichier
- Une évolution impossible ?
- Médecins du Monde : « Réduire les coûts, c'est mieux servir notre cause »
Une opération de mailing est généralement précédée par une action
d'entretien des fichiers. Le but est d'éliminer à l'avance toutes les adresses
qui ne pourront pas être atteintes, soit parce que le destinataire a déménagé,
ne souhaite plus recevoir les informations... ou parce que l'adresse elle-même
n'existe pas ! Autant de retours "N'habite pas à l'adresse indiquée" à éviter
pour augmenter l'efficacité et alléger les coûts de l'opération. « Envoyer un
mailing coûte un euro, valider l'adresse avant l'envoi coûte dix fois moins »,
remarque Eric Dhaussy, directeur général d'Altria. Ce calcul sert de
justification économique à une série de traitements assez complexes, mobilisant
une puissance informatique. « L'entretien des fichiers avant une opération de
mailing est différent selon qu'il s'agit de la prospection ou de la
fidélisation », explique Henry Journée, directeur général de BCA, spécialiste
d'analyse statistique et d'entretien des fichiers. Quand il s'agit du
recrutement, son entreprise reçoit des fichiers des sources diverses, parfois
plus de 200 fichiers pour la même campagne et dont la taille varie entre 5 000
et 100 000 adresses. Certains propriétaires de fichiers comme les Trois Suisses
demandent même à inspecter ses locaux avant de donner l'autorisation
d'utilisation, pour être certains que leurs fichiers seront en sécurité.
Normalisation des adresses
Dans les opérations de
fidélisation, la logique est naturellement différente de la prospection. Ici,
il s'agit d'enrichir le fichier des clients de l'entreprise avec des
informations provenant des bases de comportement. La correction des fichiers
est un travail rigoureux qui exige aussi un traitement manuel à l'écran, ce qui
augmente les dépenses. « Les coûts de traitement des fichiers pour une
opération de fidélisation sont en moyenne quatre fois supérieurs à ceux d'une
action de recrutement », estime Henry Journée. Le premier stade du traitement
consiste à normaliser et à restructurer les adresses. « C'est une opération
complètement automatisée. Dès lors qu'il s'agit de traiter des volumes de 20
000 adresses et plus, il n'est pas question d'une intervention manuelle »,
remarque Mohamed Messaoudi, responsable du département traitement informatique
des adresses au sein de l'agence ETO. Pour lui, la normalisation postale est
intéressante sur plusieurs plans. D'abord esthétique, avec la possibilité
d'envoyer des mailings de qualité avec des adresses libellées sans faute
d'orthographe. « Cela fait crédible quand on est supposé écrire à des clients
que l'on connaît bien », observe Mohamed Messaoudi. Quelqu'un qui reçoit un
courrier adressé à "Mlle Jean Dupont", a l'impression d'être complètement
impersonnel dans un lot. La normalisation ouvre la voie à la personnalisation.
Quand le nom, le prénom et la civilité se trouvent ensemble dans un seul champ
du fichier à la place de trois, la personnalisation est alors difficile. Il
faut identifier ces trois éléments et les placer dans trois cases dans l'ordre.
La normalisation assure le respect des normes postales, indispensable pour
bénéficier des tarifs préférentiels de La Poste grâce à l'utilisation de la
lecture optique dans le traitement automatique de l'adresse. En cas de rejet,
le courrier passe au traitement manuel et, lorsque le taux de rejet dépasse le
seuil, l'envoyeur peut se voir infliger un redressement postal d'environ 0,03
euro par envoi, sur la totalité du lot et non seulement sur les courriers
rejetés.
La nécessaire coopération des propriétaires des fichiers
« Nous commençons par uniformiser l'adresse, souvent sur
une ou deux centaines de fichiers », explique Haï Le Mong, gérant de la société
Uniservices Informatique, prestataire qui traite 300 millions d'adresses par
an. A ce moment, le but est d'isoler la civilité, le nom et le prénom pour
obtenir à la sortie un format unique. Une opération qui ne peut pas se faire
sans la coopération des propriétaires des fichiers. Ils doivent, par exemple,
indiquer au préalable leur règle de structuration, nom-prénom ou prénom-nom,
afin d'éviter à l'ordinateur de plancher sur l'éternel problème de Jacques
Martin versus Martin Jacques. Au stade suivant, le logiciel détecte les
mots-clés comme le nom de la résidence ou le numéro de l'appartement et remet
ces données à leur place. Ensuite il s'occupera de l'adresse elle-même, de ses
trois dernières lignes, faisant appel aux référentiels Hexavia et d'autres.
D'abord la validation postale, l'existence du code localité. La voie est-elle
reconnue ? Le logiciel accepte les fautes d'orthographe possibles provenant de
la saisie ou encore de l'écriture mnémonique, par exemple quand l'adresse est
dictée au téléphone. Lors d'un conflit entre le code postal et le nom de la
localité, c'est le nom qui l'emporte. A la fin, il est aussi possible
d'affecter les codes Insee des communes ou encore renseigner les tournées du
facteur. Tous les gestionnaires des fichiers ont des logiques internes
différentes et emploient des formats différents, ce qui ne facilite pas
l'entretien. Et le nouveau format préconisé par La Poste, ne s'est pas imposé
partout. La plupart des vépécistes sont certes aux normes mais pas les petites
structures ni les nouveaux arrivants sur le marché. Chez ces derniers on voit
nombre de fautes dans les adresses provenant de la saisie manuelle. Lors de la
normalisation on accepte quelques rejets, là où les machines n'ont pas pu
trouver un équivalent probable. Un taux de rejet à 4 ou 5 % est considéré comme
acceptable, mais il peut atteindre 15 % et plus sur des fichiers dont la saisie
a été réalisée à l'étranger.
De la normalisation au "nettoyage"
A partir du moment où les adresses ont été
normalisées, on peut passer au "nettoyage" du fichier. C'est le traitement par
anticipation des NPAI, grâce à la base nationale des changements d'adresses. A
ce moment, on compare aussi les listes d'adresses avec le fichier de référence
Estocade, de La Poste, qui contient les adresses non-existantes suite à un
déménagement. A raison de deux millions de changements d'adresses par an en
France, cela représente quand même près de 10 % des ménages. Cette étape est
particulièrement importante lorsqu'il s'agit d'effectuer une relance
commerciale sur les clients inactifs de plus de vingt-quatre mois. Le filtrage
avec le référentiel de La Poste permet d'éliminer plus de 15 % des adresses
inexistantes avant l'opération. Pour ces clients qui ont déménagé, on peut
aussi faire appel aux fichiers des changements d'adresses Charade, pour
connaître leur nouvelle adresse - encore que cette opération ne peut pas être
réalisée directement par le prestataire car La Poste ne diffuse pas ce fichier
à l'extérieur de ses murs. Pour faire oublier le côté plutôt unifié du
"nettoyage" - tout le monde utilise un seul et même fichier de La Poste - les
prestataires cherchent à proposer des offres plus personnelles. « Avec des
outils développés en interne, nous arrivons à dépasser le cadre de
normalisation et de restructuration habituelles, affirme Eric Dhaussy. Nous
faisons aussi du nettoyage des fichiers, nous pouvons identifier grâce au
fichier de France Télécom la présence de la personne à l'adresse
correspondante, ce qui permet d'acquérir une certitude quant à ce destinataire.
Et, pour les adresses où un doute subsiste, nous allons identifier les cas de
déménagement et les renseigner avec les nouvelles adresses. » Cette démarche de
survalidation permet d'améliorer la probabilité de toucher la cible sur le
coeur du fichier. Le degré d'effort développé ici par le prestataire sera
conditionné par la catégorie à laquelle appartiennent les adresses. Est-ce
qu'il s'agit des bons clients de l'entreprise ou non ? Un client très actif
représente une acquisition chère pour l'entreprise. On lui enverra le mailing
même si un doute subsiste. Ou bien, si le client est porteur d'une carte de
fidélité, on essaiera de valider son adresse lors du prochain passage en
caisse. Parmi d'autres enrichissements possibles, on cite la segmentation
suivant le type de commune, rurale, ouvrière, etc., l'habitat individuel ou
collectif. La date d'emménagement peut être estimée à partir de la date
d'ouverture de ligne par France Télécom. On peut réaliser une extrapolation du
niveau social ou des comportements, par exemple, à partir des données
Consodata.
Importance de la déduplication
Le dernier
stade du traitement consiste à comparer les différents fichiers d'adresses
entre eux pour éliminer les doublons. La déduplication génère une problématique
touchant à la programmation et à l'intelligence artificielle. Car la difficulté
ici est de « faire comprendre à l'ordinateur ce que l'oeil humain peut détecter
», comme le remarque Eric Dhaussy. Pour cela on va affecter des clés de
déduplication permettant de comparer les chaînes de caractères à l'intérieur de
ces clés, avec des dictionnaires des références. Par exemple, pour M. Dupont
habitant rue du Général de Gaulle, d'abord effectuer une validation postale,
vérifier que la rue existe bien dans la localité, comparer avec toutes les
variantes des écritures pour le code de la voie, le numéro dans la voie, le
nom, le prénom. L'ensemble de ces algorithmes permet de retrouver les doublons
probables. A partir de là, on va trier le fichier en deux groupes : celui des
adresses uniques et celui des doublons possibles. La suite dépendra des règles
de déduplication définies à l'avance par l'annonceur. Ces règles sont établies
sur une échelle allant de "trop" à "pas assez". Dans le premier cas de figure,
appelé aussi "overkill", on élimine jusqu'aux "faux doublons", par exemple
plusieurs Jacques Durand habitant dans le même immeuble et dont on ne peut pas
préciser lequel est déjà client de l'entreprise. L'objectif est d'éviter que
les offres promotionnelles particulièrement alléchantes ne soient pas adressées
à des personnes déjà clientes de l'annonceur. Dans le deuxième cas, dit
"underkill", on gardera même les "vrais" doublons quitte à envoyer peut-être
plusieurs courriers à la même personne. La puissance de l'informatique joue un
rôle crucial dans la précision de la déduplication. Uniservices utilise à ce
stade deux types de matériel, un gros ordinateur "mainframe" d'IBM et deux
serveurs sous Windows NT. L'application de normalisation postale POST a été
enrichie avec des couches logicielles développées par les informaticiens de
l'entreprise. Haï Le Mong estime que « même si certains noms dits à risque,
comme Durant - Durand, nous empêchent d'atteindre une fiabilité absolue, les
méthodes que nous utilisons sont quand même fiables à 98 % ».