E-marketing.fr Le site des professionnels du marketing

Recherche
Magazine Marketing

Comment donner du sens à vos données ?

Publié par le

L'analyse des données marketing permet d'utiliser les informations contenues dans les bases de données pour améliorer la connaissance des consommateurs. A l'avenir, ces techniques seraient en mesure d'analyser des informations inscrites en texte et d'interpréter des réponses à des questions ouvertes. Une révolution dans la gestion de la relation client.

Je m'abonne
  • Imprimer


L'analyse des données devient-elle indispensable pour le bon fonctionnement des services marketing et plus largement, des entreprises ? Le "data mining" répond précisément aux besoins de comprendre la relation client, ses comportements, d'optimiser la prospection pour diminuer les coûts d'acquisition et d'agir sur la rentabilité de la campagne de marketing direct.

« Davantage qu'auparavant, l'analyse est aujourd'hui nécessaire car les entrepôts de données deviennent plus nombreux, avec des structures informatiques adéquates et un niveau de détails plus important », confie Anne Gayet, responsable data mining chez AID, spécialiste en bases de données marketing.

Selon elle, « l'objectif est de donner du sens aux données. Les agréger pour en extraire des indicateurs valables, sélectionner les plus pertinents du point de vue marketing. » Pour réussir l'analyse, il faut d'abord identifier les problèmes de qualité de l'information comme des données non valables, un historique pas homogène. Avec l'évolution de l'entreprise et de ses gammes de produits, le questionnaire bouge aussi. Par exemple, on peut passer de deux réponses à trois, voire davantage de réponses possibles à la même question. L'un des objectifs reconnus du data mining est d'allonger la durée de vie d'un client en repérant les risques de son départ. Une évaluation de ces risques en parallèle avec la valeur prévisionnelle de celui-ci permet au service marketing de décider si l'on souhaite ou non le garder, et alors mettre en oeuvre des actions de rétention, par exemple des cadeaux pour motiver un réabonnement anticipé, etc. Quant à la valeur potentielle du client, on ne peut que faire des projections en se basant sur sa consommation actuelle. « Dans la téléphonie mobile, cela peut être la valeur de son abonnement, mais aussi sa consommation de SMS et de services associés, l'utilisation fréquente et variée qu'il en fait et qui prouve que son mode de vie est en phase avec le produit, explique Anne Gayet. Dans la télévision par câble, c'est la consommation des services interactifs et des films payants à la séance qui fournira l'indication. Le risque, ici, c'est de mal évaluer les clients récents. Acquis grâce à une campagne de prix agressifs et avec le nombre d'options artificiellement élevé, ils seront plus enclins au départ. Il est donc important d'identifier les options provenant d'une promotion et celles prises volontairement. »

Pas de modèle générique


Les questions liées au data mining sont récurrentes, mais pour autant, il n'y a pas de modèle générique pouvant servir dans différents cas de figure. A chaque fois, la construction d'un modèle commence par l'analyse des besoins marketing et des moyens d'agir, avec des plans-tests. Parmi les données à disposition, quelles sont les fondamentales qui manquent ? Par exemple, il est intéressant de savoir si les contacts téléphoniques avaient pour origine une réclamation du client ou bien un incident de paiement ? Viennent ensuite l'agrégation des données et la création des indicateurs : récence-fréquence-montant, date du dernier contact, critères socio-démographiques, etc. A partir de là, les logiciels permettent d'identifier les critères pertinents et de construire des algorithmes prédictifs. Cela peut être la régression logistique, l'analyse discriminante, l'arbre de segmentation, le réseau de neurones, etc. Enfin une campagne test servira à prouver l'efficacité du modèle. Et, par la suite, il faudra vérifier régulièrement la pertinence du modèle et des actions attachées. Comme la concurrence et les offres évoluent vite, le modèle doit lui aussi pouvoir évoluer.

Hélène Ivanoff, directrice associée de Complex Systems, spécialiste de la GRC analytique, note le changement dans l'argumentaire concernant l'analyse des données : « Avant, on mettait l'accent sur la connaissance du client. Aujourd'hui, on parle davantage du retour sur investissement. Ce changement a aussi influencé le choix des techniques. Le ciblage nécessite des scores et des arbres, tandis que la connaissance fait appel à des typologies. Mais avant tout, le ciblage, c'est l'objectif, et la connaissance, le moyen d'y parvenir. Et c'est une évolution des priorités des entreprises. Plutôt que de créer de nouveaux produits, elles souhaitent un meilleur ciblage pour les produits existants. »

« Nous assistons à une forte croissance du volume des données collectées en entreprises, grâce notamment à l'informatisation des systèmes comptables, de la gestion des ressources (ERP), des bases de marketing direct, analyse René Lefebure, directeur marketing et conseil banque chez Soft Computing, un spécialiste de la GRC. Le e-commerce a aussi apporté une contribution. Avant, le contact avec le client se limitait à deux ou trois ventes par an. Aujourd'hui, il va se manifester plusieurs fois pour demander des renseignements ou recevoir une lettre d'information avant d'acheter. »

L'évolution du data mining concerne en premier lieu les secteurs producteurs des données. La grande distribution est en train de passer de la notion du chariot à celle du client moyen grâce à l'analyse du ticket de caisse. On peut connaître le nombre d'enfants suivant le nombre de yaourts achetés, comprendre l'importance que ce client accorde à la nourriture bio, etc. L'analyse permet de traiter ces données de manière industrielle, avec un nombre de paramètres plus important. Par exemple, on peut tenir compte de la couleur des articles achetés. Et retrouver des corrélations intéressantes entre la couleur et le potentiel d'achat. Les couleurs vives signifient souvent que le client attache plus d'importance à la dimension séduction d'un vêtement qu'à sa dimension d'usage. Il risque d'en acheter davantage. L'approche exploratoire de l'analyse permet de rechercher toutes les corrélations possibles. Elle permet aussi de vérifier les hypothèses du service marketing, mais sans nécessairement savoir si l'hypothèse est meilleure. « Toute l'intelligence se situe dans la manière de préparer les variables en amont, poursuit René Lefebure. Par exemple, se pencher sur le nombre de jours qui s'écoulent entre deux achats, ou encore sur la séquence d'achats sur les douze derniers mois. Il ne faut surtout pas croire qu'il suffit d'introduire des données en vrac et d'appuyer sur un bouton ! La préparation, la formulation des questions consomment facilement jusqu'à 80 % du temps de travail sur une analyse. »

Une grande variété de techniques


Quelles sont les techniques utilisées dans le data mining ? La grande distribution est favorisée par le grand nombre de produits dans le panier et par une fréquence d'achats forte. Ici, on utilise en priorité la technique d'association de produits. Les grandes surfaces spécialisées donnent l'exemple. Le client qui achète une baignoire va probablement envisager l'achat de robinets. Il existe des cas plus complexes. Le client qui achète de la peinture aura sans doute besoin de pinceaux et de White-spirit. Mais quel genre de peinture achète-t-il ? Si c'est pour peindre des parpaings, il s'agit de travaux extérieurs et plus souvent d'une logique de petits prix. Mais, si c'est pour peindre des cadres, faire de la décoration intérieure, l'acheteur, le plus souvent une femme, va préférer le conditionnement en petits pots et ne rechignera pas devant des prix plus élevés. Les arbres de décision dans le marketing direct sont dédiés au ciblage et à des calculs de volumétrie. Le scoring permet d'attacher la probabilité d'un événement à une personne, par exemple calculer le risque des départs dans un programme de carte de fidélité. Le raisonnement à base de cas est prisé par les services après-vente des industriels. Cette méthode consiste à attacher un problème à un autre problème déjà répertorié dans la BDD, en s'appuyant sur des indications indirectes fournies par les capteurs de la machine défaillante. Son avantage permet un premier diagnostic de l'équipement stationnaire, avant tout déplacement de l'équipe de dépannage. Les techniques "exotiques", comme les réseaux neuronaux, offrent la capacité de construire des scores, mais avec un niveau d'interprétation plus complexe. La structure polynomiale permet de réunir tous les variables dans une multiplication avec différents coefficients attachés. Ces techniques sont utilisées dans la surveillance des centrales nucléaires. Certaines méthodes ont été développées spécialement pour les besoins d'analyse marketing. Comme celle utilisée par Cetelem depuis plusieurs dizaines d'années.

« Le coeur de notre méthode est basé sur l'analyse canonique séquentielle, une technique dite géométrique, par opposition à des techniques algorithmiques », explique Michel Masson, administrateur de Cofidis et fondateur de Cofidis Data mining. Cofidis, spécialiste du crédit par téléphone, est réputé pour son savoir-faire en matière d'analyses statistiques et mathématiques de fichiers. Selon Michel Masson, la différence des méthodes est importante pour l'utilisation que les services marketing pourront faire des résultats. Les techniques algorithmiques représentent une sorte de boîte noire. C'est un inconvénient pour l'analyse car, tant que l'on ne sait pas comment la réponse est fabriquée, on ne peut pas faire de progrès dans l'amélioration de la méthode ni analyser la dynamique des modifications du comportement des consommateurs. Avec la méthode géométrique, en revanche, les phases intermédiaires sont lisibles. La méthode consiste à élaborer un modèle multidimensionnel avec des axes-variables : CSP, ancienneté dans l'emploi, région, etc. Certains axes représentent des valeurs non quantifiables, celles que l'on dit avec un mot et non avec un chiffre. Le traitement de ce modèle ne peut alors pas être réalisé par simple addition des chiffres, mais nécessite des analyses géométriques non linéaires. « Par ces techniques, nous avons cherché à séparer les payeurs des non-payeurs, mais aussi à séparer des catégories supplémentaires, par exemple ceux qui ont fait appel à des commissions de surendettement, poursuit Michel Masson. Certains de ceux-là auraient très bien pu payer, mais ont préféré un passage devant la commission pour ne pas le faire ou payer moins. Les séparer en une catégorie indépendante nous paraît obligatoire pour maintenir la qualité du modèle mathématique. » Une description précise des catégories amène logiquement vers la construction des modèles prédictifs. « Ici, il est important d'introduire la dimension temps, remarque Michel Masson, d'analyser l'historique d'un client dans sa dynamique et non comme une compilation de photos instantanées. » Il est aussi important de tenir compte des enchaînements : Monsieur Dupond a fait ceci avant de faire cela et non l'inverse. Pour introduire cette dimension, on fait appel à des méthodes utilisées ailleurs, dans la modélisation économique précisément. « La possibilité d'analyser l'évolution dans le temps est notre point de différence avec les autres techniques d'analyse de données », souligne Michel Masson. La méthode est destinée aux secteurs banque, assurance, VPC, auto, téléphonie, à tous ceux qui possèdent des fichiers avec une dimension historique. La dimension historique permet d'obtenir une segmentation autre que le RFM classique, et parfois plus pointue. L'analyse des données offre l'occasion de mettre à profit un grand nombre d'informations stockées dans les bases de données marketing. Mais les informations structurées, déjà regroupées en colonnes de chiffres, ne représentent qu'une partie des données stockées. Reste la question "que faire des données textuelles" ? La satisfaction client, la fraude, la qualité du service sont des notions décrites avec des mots. « Les nouveaux outils de "text mining" permettent de transformer les mots et séquences en vecteurs sémantiques associés à des idées, par exemple satisfaction ou insatisfaction », affirme René Lefebure. Ce "reniflage" dans le texte ne permet pas d'en comprendre le sens, mais facilite l'aiguillage vers les agents compétents lors du traitement des e-mails. A l'avenir, le text mining pourrait offrir l'opportunité d'analyser de manière automatique des réponses à des questions ouvertes. Et ouvrir une nouvelle direction dans le développement des méthodes d'analyse marketing.

CAAM : portraits-robots des clients et prospects


« Nous avions besoin d'analyser les profils des porteurs des Sicav pour déduire les profils des prospects », explique Bernard Lentz, responsable marketing et statistiques chez Crédit Agricole Asset Management. Cette société gère l'ensemble des Sicav pour le compte du groupe Crédit Agricole, soit 2 millions de porteurs répartis sur 48 caisses. Son objectif est de réaliser des ciblages dans la base du système d'information marketing. Cette base comprend les 4,5 millions de clients de la banque répertoriés de manière anonyme, sans nom ni adresse. En revanche, elle est renseignée sur la situation matrimoniale, l'âge, le montant du portefeuille, etc. A partir de ces éléments, le gestionnaire cherche à établir les portraits-robots des porteurs. « Nous pouvons analyser la répartition des actifs, c'est un paramètre important pour déduire le niveau de risque du portefeuille, analyse Bernard Lentz. Pour lui proposer de nouveaux placements, l'argumentaire sera différent. » L'outil d'analyse de CAAM est composé de trois éléments. Au premier stade, un outil d'interrogation, "Impromptu", permet de générer les sélections sous Excel ou en fichier texte pour les grands volumes. Ensuite, l'outil Spad de Decisia réalise le traitement statistique et de typologie, calcule les variables dérivés, définit des classes. En dernier lieu, l'outil Alice d'Isoft réalise un ciblage plus précis avec des arbres de décision. « J'ai défini cinq classes et il m'explique les critères d'affectation, ajoute Bernard Lentz. Je peux mélanger les clients qui sont partis avec ceux qui restent. Le logiciel va identifier les variables corrélés pour le départ. A partir de là, nous mettrons en place des actions marketing classiques. » Le directeur marketing de CAAM apprécie la convivialité de l'outil que l'on peut utiliser sans formation spécifique. Son seul reproche : Alice ne sait pas gérer l'ensemble du processus d'analyse, ce qui oblige l'opérateur à faire appel à trois outils distincts.

Sélection du Reader's Digest optimise la sélection des fichiers


« Nous cherchions à optimiser les sélections pour la prospection et pour le renouvellement de notre fichier », témoigne Muriel Glatin, directrice des fichiers Europe chez Sélection du Reader's Digest. Son entreprise réalise quatre campagnes de recrutement par an. Le fichier client contient 5,5 millions de noms. Quant au volume de prospection, il peut être compris entre 5 et 12 millions de messages par an. « Il nous faut trouver les meilleurs critères pour sélectionner parmi les fichiers disponi- bles auprès des brokers et ensuite réaliser des segmentations, poursuit Muriel Glatin. Complex Systems nous aide à enrichir des fichiers peu renseignés avec des données externes, recensement, urbanité. Grâce à sa prestation, nous arrivons à identifier les critères discrimi-nants et à construire un modèle de probabilité de réponse à notre offre. »

Duc : un tri par typologie de décideurs


« Notre société, qui s'adresse aux grandes et moyennes surfaces, avait peu de visibilité sur le potentiel national des prospects », déclare Tony Capizzo, responsable des forces de vente GMS chez le volailler Duc. Avec l'aide du cabinet NDC et de la société FDV Conseil, il a mis en place un fichier informatique alimenté par les commerciaux. Ce système permet de réaliser des ciblages parmi les décideurs à différents échelons, pour l'envoi des mailings réguliers sur des lancements ou des promotions, et de la lettre institutionnelle. « Dans cette méthodologie de classification des clients, nous faisons le tri par typologie en mettant l'accent sur le circuit décisionnel, poursuit Tony Capizzo. Qui appeler en cas d'absence de notre interlocuteur habituel ? Où le joindre ? Nos produits nous imposent d'aller très vite en cas de pépin. » Tony Capizzo est satisfait de l'outil, même s'il admet ne pas l'exploiter à 100 %. « Cette possibilité de réaliser des opérations très rapidement est indispensable pour le commerce moderne », conclut-il.

 
Je m'abonne

Alexis Nekrassov

NEWSLETTER | Abonnez-vous pour recevoir nos meilleurs articles