Accueil / Data

Une technique à combinaison variable

Le scoring fait partie des techniques connues, mais les spécialistes du marketing en ignorent parfois les enjeux et les limites. Pourtant, de nombreuses approches existent : si les méthodes classiques n'évoluent que très peu d'un point de vue mathématique, en revanche, les possibilités d'évolution se trouvent dans leur application pour réaliser des analyses complexes.

Publié par Alexis Nekrassov le 1 déc. 2002

Lecture
13 min

Imprimer

À LIRE AUSSI

Beaucoup d'entreprises utilisent aujourd'hui le scoring ou en font la promotion... sans le savoir, comme le célèbre Monsieur Jourdain. Dès que l'on parle du "CRM analytique", ce concept à la mode pour nommer l'analyse des données, on fait aussi allusion au scoring. Le score est une hiérarchie des données, des moins bonnes au meilleures. Dans le marketing direct, il sert à évaluer, à noter quelqu'un en fonction de sa propension à faire ou ne pas faire quelque chose, par exemple acheter ou ne pas acheter. Pour cela, il faut étudier les individus qui ont le même comportement, qui ont acheté ou ont arrêté d'acheter le produit en question. A partir de là, on peut calculer un score d'appétence ou d'attrition. « Le scoring, dans sa définition statistique, c'est l'art de combiner des variables quantitatives et qualitatives pour expliquer une variable quantitative, estime Gilles Venturi, directeur général de Soft Computing. Quand on regarde l'ensemble des techniques utilisées pour la prédiction, il n'y a pas que le scoring, il existe également d'autres méthodes. » D'où l'intérêt, pour les spécialistes du marketing, de mettre plusieurs méthodes en compétition. Pour Anne Gayet, responsable de l'analyse des données chez AID, « les changements dans le scoring se trouvent essentiellement du côté des logiciels. Ils permettent aujourd'hui d'industrialiser la démarche, apportent aussi de l'aide à certaines étapes, comme celles de l'échantillonnage ou de la comparaison des méthodes entre la segmentation, la régression logistique et les réseaux de neurones. » Les logiciels permettent de comparer la performance de plusieurs méthodes par rapport à un ensemble de données et à une problématique unique. Avant, ce travail était réalisé à la main, ce qui prenait beaucoup de temps et rendait la démarche coûteuse. « Le scoring permet d'optimiser l'envoi des mailings en sélectionnant les destinataires suivant leur propension à répondre de manière favorable », affirme Christian Colot, ingénieur d'études chez BCA. Deux types de score sont établis : d'affinité et de répondant. Pour le score de répondant, on analyse les réponses aux envois déjà réalisés. Pour l'affinité, BCA procède à des comparaisons avec les bases de données Consodata (3,1 millions d'adresses prospectables), les bases de données de France Télécom (19 millions d'adresses), etc. On utilise alors les critères d'âge en fonction du prénom, du sexe, les critères urbanistiques, comme le niveau d'urbanisme, l'environnement social, le type d'habitat. On identifie le profil type du client pour de nouveaux produits. Et, s'il s'agit du même type de clients que ceux déjà acquis, on analyse la base. En revanche, si le produit doit amener un type de clients nouveaux, ce n'est pas le score qui sera utilisé car cette méthode ne sera pas pertinente. Dans ce cas, on utilisera plutôt la typologie. « Le but est d'améliorer le taux de réponse par rapport à un envoi aléatoire », poursuit Christian Colot. Quand on réalise une étude de score, il faut définir les critères discriminants "client ou pas client". Cela amène de nouvelles questions, par exemple celle de savoir quel type de presse lisent les clients. On aboutit à une meilleure connaissance de ces derniers. « Il existe deux catégories de score : celle destinée aux applications risque et celle destinée aux applications marketing. Dans les deux cas, les techniques sont les mêmes. Il s'agit de mettre en relation un certain nombre de caractéristiques pour donner une note qui définit les individus par rapport à la question », explique Sylvain Chamley, responsable de l'analyse des données chez Experian, qui gère en Grande-Bretagne la base commune de différents établissements financiers, banques et assurances, et d'opérateurs télécom (en France, ces pratiques sont limitées). « Pour estimer le risque, on se sert de l'âge, de l'ancienneté dans la profession, du revenu, de la catégorie socio-professionnelle, du type d'habitat, poursuit Sylvain Chamley. Pour des applications marketing, on utilise en principe les mêmes caractéristiques avec en plus des informations sur le comportement. » En évaluant des probabilités, il est possible de faire des prévisions de gain par rapport à la situation existante. Les gains escomptés grâce à la mise en place du scoring peuvent se situer entre 20 et 50 % par rapport à la démarche traditionnelle.

Quelles variables utiliser ?

« Les marques ont essayé de scorer leurs clients avec trois, quatre ou cinq bonnes questions posées dans un centre d'appels. C'est un score prédictif en ligne, il permet d'attribuer au client une probabilité d'appartenir à un groupe d'acheteurs », explique Thierry Vallaud, directeur des études et de la prospective chez D interactive. Qui remarque que la confiance que l'on peut accorder aux résultats dépend de la richesse de l'historique étudié : « Le scoring est plutôt destiné à l'analyse des données quantitatives. Il n'y a pas de modèle statistique permettant d'utiliser véritablement des données qualitatives afin d'améliorer le score, mais on peut injecter ces données dans des analyses quantitatives. » « Il est important de suivre l'évolution des variables dans le temps, souligne Mahamoud Azihari, directeur de Cofidis Datamining. Par exemple, la détention d'un téléphone portable signifiait, à une certaine époque, l'appartenance à la catégorie des jeunes cadres dynamiques, des gens qui avaient le comportement de leur classe sociale. Aujourd'hui, la situation s'est inversée. Les étudiants, les chômeurs, les femmes au foyer ont un portable. Cette information n'est pas distinctive. En revanche, la question "Voyagez-vous en Concorde ?" reste toujours pertinente, c'est une variable stable. » Parfois, il est intéressant de produire des variables d'interaction à partir des basiques. Un exemple classique en sociologie : aux Etats-Unis, les riches risquent moins la peine de mort que les pauvres. Et les Blancs moins que les Noirs. Mais un Noir riche risque moins qu'un Blanc pauvre (et la chronique judiciaire récente l'a prouvé). La réunion de ces deux critères - couleur de peau et ressources - constitue une variable d'interaction qui peut être plus pertinente que chacune des deux variables prise séparément. Peut-on mélanger des variables de types différents ? « C'est assez difficile. Nous avons encore peu de moyens pour traiter intelligemment le mélange des données quantitatives et qualitatives », répond Anne Gayet. Les données quantitatives proviennent des systèmes de gestion, par exemple le nombre d'achats, le montant des achats ou des abonnements, le pourcentage d'évolution. Les données qualitatives proviennent des questionnaires d'adhésion au programme de fidélité. Elles comprennent la catégorie socioprofessionnelle, par exemple. Divers traitements sont possibles. Les données quantitatives peuvent être découpées en tranches d'âge et devenir qualitatives. Et la catégorie socioprofessionnelle peut aussi être décrite de manière binaire, avec un "Oui" ou un "Non". Apporter une aide logicielle pour la préparation des données serait un grand pas. L'élaboration d'un score est une affaire d'expertise, de connaissance des données. La gestion des connaissances des données est de plus en plus importante. Les spécialistes du scoring, qui travaillent sur le passé pour essayer de voir dans le futur, sont obligés de se pencher sur des données telles qu'elles étaient stockées à l'époque. Mais, entre-temps, les règles de stockage ont pu changer. Dans un questionnaire d'adhésion, par exemple, il y a aujourd'hui plus d'options de réponses à la même question. Les modèles doivent ainsi être valables pour le moment présent, mais aussi dans un futur proche. Attention donc à l'évolution du mode d'alimentation.

Des méthodes plutôt classiques

Côté technique, le scoring est basé sur des méthodes classiques et qui n'évoluent que très peu, d'un point de vue mathématique. En revanche, les possibilités d'évolution se trouvent dans leur application pour réaliser des analyses complexes. Et là, toutes les possibilités ne sont pas encore explorées. Quand il n'y a que deux modalités de réponse, elles produisent une seule note et l'analyse est assez simple. Mais, avec des questionnaires à réponses multiples, il faut appliquer des méthodes multiprédictives, pour élaborer des modèles sur plusieurs axes. « Les méthodes multiprédictives sont assez développées dans la médecine, pour étudier la probabilité des différentes pathologies. Elles sont peu utilisées dans le marketing, sinon pour le secteur des voyages », constate Mahamoud Azihari. La Banque de France utilise l'analyse discriminatoire pour traiter des variables explicatives continues, comme le chiffre d'affaires et le ratio de solvabilité dans l'analyse de risque de faillite. American Express fait appel aux régressions logistiques binaires pour prendre en compte des variables continues ou découpées, quantitatives et qualitatives. « La technique des "réseaux de neurones" est utile quand il s'agit de faire du prédictif sans explication. Par exemple, juste savoir que telle personne a une probabilité élevée de dire oui à la proposition, sans comprendre pourquoi », explique Mahamoud Azihari. Quelle est la fiabilité d'un score ? Cette méthode mathématique consiste à trier les futurs clients du plus au moins probable. La fiabilité, ici, n'est pas liée à la technique de tri, mais dépend de l'analyse marketing préalable. Pour élaborer une bonne méthode, il faut déterminer l'ensemble des critères qui distinguent le client du non-client. On va associer une note suivant la profondeur d'information que ce critère apporte. Le meilleur segment du score correspond souvent à 6 ou 7 % de l'ensemble. Il peut assurer un taux de retour trois fois supérieur à la moyenne. Par exemple, dans les assurances-vie et suivant le critère d'âge, un foyer de plus de 55 ans peut avoir une note de 20, tandis qu'un foyer de moins de 30 ans aura une note de 10. Les premiers seront bien plus proches des produits d'assurance-vie. Mais il ne faut pas considérer la note elle-même comme une distance chiffrée entre ces deux types de clients.

Les limites du score ?

« On prend comme hypothèse que ce qui s'est passé va se reproduire. Or, c'est de moins en moins vrai, surtout par rapport à l'apparition de nouveaux types de produits, constate Anne Gayet. Les marchés évoluent très vite, il faut pouvoir s'adresser au passé récent et ne prévoir qu'un futur très proche, sans aller au-delà. On nous demande de quantifier le futur taux d'achat de produits. Le score ne sait pas répondre à cette demande. » Le score de volatilité permet de hiérarchiser les clients. Mais il ne répond pas à la question "Combien de temps mon client va-t-il rester ?". Ce n'est plus le score, mais des modèles de durée de vie qui doivent y répondre. Le but du score est de faire changer le comportement du client, or cela raccourcit la durée de vie des modèles. Quels sont les secteurs concernés par le scoring ? « Parmi nos clients, le scoring est surtout utilisé par les banques pour des besoins marketing et par des distributeurs pour des problèmes de fidélité, par les opérateurs télécom et les fournisseurs d'accès internet, pour des analyses du phénomène d'attrition », confirme Gilles Venturi. Les assurances-vie, la vente par correspondance, le crédit à la consommation, le caritatif comptent parmi les secteurs demandeurs de scoring. En revanche, certains marchés, comme l'automobile, n'y font pas appel. Les professionnels du secteur automobile ont accès aux immatriculations des véhicules. Pour eux, il est plus facile d'étudier ces renseignements plutôt que de faire du scoring. Et, de manière générale, pour les secteurs qui communiquent à la télévision, le score n'a pas grand sens. Le domaine bancaire a été parmi les premiers utilisateurs du scoring. Ici, il n'y a que peu de problèmes liés à la structure des données. Les informations sont quantitatives, observées ou parfois déclaratives. Et, encore très souvent, on demande au client des justificatifs de ses déclarations. Les différences entre un client nouveau et un client existant sont dans la nature des informations. Dans le premier cas, il s'agit de données obtenues grâce à un partenaire ou bien de données déclaratives contrôlées. Dans le deuxième cas, ce sont les informations de l'historique client. Dans le premier cas, la problématique est liée à l'attribution d'un crédit, à l'ouverture d'un compte, à la délivrance de cartes bancaires. Dans le deuxième cas, la problématique est à peu près la même, mais les informations sont plus riches. Et, en plus, il faut analyser des problèmes de décision de paiement, des actions par rapport à un dépassement de l'autorisation, à des débits supérieurs. Dans le cas d'un recouvrement, il faut optimiser l'action sur les impayés. Doit-on envoyer une lettre de relance ? Ouvrir un contentieux ? Le type d'action sera décidé en fonction du comportement du client. Idem pour définir un montant de découvert, délivrer une carte bancaire à débit immédiat ou différé, ou pour proposer une montée en gamme de produits. Le Crédit Agricole, par exemple, utilise le scoring pour cibler l'envoi des mailings aux clients qui seront intéressés par l'offre, tout en minimisant le risque. Il s'agit de placer des produits classiques ou revolving. Le taux de retour est alors supérieur à 10 %, soit le double de ce qui se pratique généralement. Et le risque est maintenu à un niveau constant par rapport aux conditions habituelles.

Et sur le Web ?

Le besoin d'approfondir les analyses scoring dans le domaine bancaire a encore augmenté depuis l'apparition des commissions Neiertz sur le surendettement. Il a fallu inclure dans les analyses la situation "surendettement" comme une situation transitoire entre le bon et le mauvais payeur. On a beaucoup parlé de scoring à l'époque du développement du commerce électronique. On pensait qu'il serait possible de faire du marketing personnalisé en ligne d'après le profil du client, se basant sur deux ou trois questions pertinentes. En effet, il est possible aujourd'hui de créer des scores à partir des données sur Internet avec des logiciels comme Vignette. Mais faut-il le faire ? « Souvent, la mise au point d'un scoring pour le commerce électronique coûte plus cher que le résultat attendu et le gain escompté », observe Thierry Vallaud. Tandis qu'en marketing direct classique, le scoring et la segmentation s'amortissent très bien. « Nous ne pratiquons pas le score en ligne sur des sites internet pour des ventes aux particuliers, uniquement pour des entreprises », précise Sylvain Chamley. La raison est qu'en France, on ne peut pas refuser une offre en ligne sur un site, il faut que la demande soit analysée par une personne. En revanche, il est possible de faire de la tarification en ligne. Experian l'a mise en place pour une filiale assurance de Fiat. En dehors de quelques applications de ce type, l'offre de score en ligne reste purement virtuelle.

Publié par :
Alexis Nekrassov

Tags associés :

#FRANCE TÉLÉCOM