Une technique à combinaison variable
Le scoring fait partie des techniques connues, mais les spécialistes du marketing en ignorent parfois les enjeux et les limites. Pourtant, de nombreuses approches existent : si les méthodes classiques n'évoluent que très peu d'un point de vue mathématique, en revanche, les possibilités d'évolution se trouvent dans leur application pour réaliser des analyses complexes.
Je m'abonneÀ LIRE AUSSI
Beaucoup d'entreprises utilisent aujourd'hui le scoring ou en font la
promotion... sans le savoir, comme le célèbre Monsieur Jourdain. Dès que l'on
parle du "CRM analytique", ce concept à la mode pour nommer l'analyse des
données, on fait aussi allusion au scoring. Le score est une hiérarchie des
données, des moins bonnes au meilleures. Dans le marketing direct, il sert à
évaluer, à noter quelqu'un en fonction de sa propension à faire ou ne pas faire
quelque chose, par exemple acheter ou ne pas acheter. Pour cela, il faut
étudier les individus qui ont le même comportement, qui ont acheté ou ont
arrêté d'acheter le produit en question. A partir de là, on peut calculer un
score d'appétence ou d'attrition. « Le scoring, dans sa définition
statistique, c'est l'art de combiner des variables quantitatives et
qualitatives pour expliquer une variable quantitative,
estime Gilles Venturi, directeur général de Soft Computing. Quand on regarde
l'ensemble des techniques utilisées pour la prédiction, il n'y a pas que le
scoring, il existe également d'autres méthodes. » D'où l'intérêt, pour les
spécialistes du marketing, de mettre plusieurs méthodes en compétition. Pour
Anne Gayet, responsable de l'analyse des données chez AID, « les changements
dans le scoring se trouvent essentiellement du côté des logiciels. Ils
permettent aujourd'hui d'industrialiser la démarche, apportent aussi de l'aide
à certaines étapes, comme celles de l'échantillonnage ou de la comparaison des
méthodes entre la segmentation, la régression logistique et les réseaux de
neurones. » Les logiciels permettent de comparer la performance de plusieurs
méthodes par rapport à un ensemble de données et à une problématique unique.
Avant, ce travail était réalisé à la main, ce qui prenait beaucoup de temps et
rendait la démarche coûteuse. « Le scoring permet d'optimiser l'envoi des
mailings en sélectionnant les destinataires suivant leur propension à répondre
de manière favorable », affirme Christian Colot, ingénieur d'études chez BCA.
Deux types de score sont établis : d'affinité et de répondant. Pour le score de
répondant, on analyse les réponses aux envois déjà réalisés. Pour l'affinité,
BCA procède à des comparaisons avec les bases de données Consodata (3,1
millions d'adresses prospectables), les bases de données de France Télécom (19
millions d'adresses), etc. On utilise alors les critères d'âge en fonction du
prénom, du sexe, les critères urbanistiques, comme le niveau d'urbanisme,
l'environnement social, le type d'habitat. On identifie le profil type du
client pour de nouveaux produits. Et, s'il s'agit du même type de clients que
ceux déjà acquis, on analyse la base. En revanche, si le produit doit amener un
type de clients nouveaux, ce n'est pas le score qui sera utilisé car cette
méthode ne sera pas pertinente. Dans ce cas, on utilisera plutôt la typologie.
« Le but est d'améliorer le taux de réponse par rapport à un envoi aléatoire »,
poursuit Christian Colot. Quand on réalise une étude de score, il faut définir
les critères discriminants "client ou pas client". Cela amène de nouvelles
questions, par exemple celle de savoir quel type de presse lisent les clients.
On aboutit à une meilleure connaissance de ces derniers. « Il existe deux
catégories de score : celle destinée aux applications risque et celle destinée
aux applications marketing. Dans les deux cas, les techniques sont les mêmes.
Il s'agit de mettre en relation un certain nombre de caractéristiques pour
donner une note qui définit les individus par rapport à la question », explique
Sylvain Chamley, responsable de l'analyse des données chez Experian, qui gère
en Grande-Bretagne la base commune de différents établissements financiers,
banques et assurances, et d'opérateurs télécom (en France, ces pratiques sont
limitées). « Pour estimer le risque, on se sert de l'âge, de l'ancienneté dans
la profession, du revenu, de la catégorie socio-professionnelle, du type
d'habitat, poursuit Sylvain Chamley. Pour des applications marketing, on
utilise en principe les mêmes caractéristiques avec en plus des informations
sur le comportement. » En évaluant des probabilités, il est possible de faire
des prévisions de gain par rapport à la situation existante. Les gains
escomptés grâce à la mise en place du scoring peuvent se situer entre 20 et 50
% par rapport à la démarche traditionnelle.
Quelles variables utiliser ?
« Les marques ont essayé de scorer leurs clients avec
trois, quatre ou cinq bonnes questions posées dans un centre d'appels. C'est un
score prédictif en ligne, il permet d'attribuer au client une probabilité
d'appartenir à un groupe d'acheteurs », explique Thierry Vallaud, directeur des
études et de la prospective chez D interactive. Qui remarque que la confiance
que l'on peut accorder aux résultats dépend de la richesse de l'historique
étudié : « Le scoring est plutôt destiné à l'analyse des données quantitatives.
Il n'y a pas de modèle statistique permettant d'utiliser véritablement des
données qualitatives afin d'améliorer le score, mais on peut injecter ces
données dans des analyses quantitatives. » « Il est important de suivre
l'évolution des variables dans le temps, souligne Mahamoud Azihari, directeur
de Cofidis Datamining. Par exemple, la détention d'un téléphone portable
signifiait, à une certaine époque, l'appartenance à la catégorie des jeunes
cadres dynamiques, des gens qui avaient le comportement de leur classe sociale.
Aujourd'hui, la situation s'est inversée. Les étudiants, les chômeurs, les
femmes au foyer ont un portable. Cette information n'est pas distinctive. En
revanche, la question "Voyagez-vous en Concorde ?" reste toujours pertinente,
c'est une variable stable. » Parfois, il est intéressant de produire des
variables d'interaction à partir des basiques. Un exemple classique en
sociologie : aux Etats-Unis, les riches risquent moins la peine de mort que les
pauvres. Et les Blancs moins que les Noirs. Mais un Noir riche risque moins
qu'un Blanc pauvre (et la chronique judiciaire récente l'a prouvé). La réunion
de ces deux critères - couleur de peau et ressources - constitue une variable
d'interaction qui peut être plus pertinente que chacune des deux variables
prise séparément. Peut-on mélanger des variables de types différents ? « C'est
assez difficile. Nous avons encore peu de moyens pour traiter intelligemment le
mélange des données quantitatives et qualitatives », répond Anne Gayet. Les
données quantitatives proviennent des systèmes de gestion, par exemple le
nombre d'achats, le montant des achats ou des abonnements, le pourcentage
d'évolution. Les données qualitatives proviennent des questionnaires d'adhésion
au programme de fidélité. Elles comprennent la catégorie socioprofessionnelle,
par exemple. Divers traitements sont possibles. Les données quantitatives
peuvent être découpées en tranches d'âge et devenir qualitatives. Et la
catégorie socioprofessionnelle peut aussi être décrite de manière binaire, avec
un "Oui" ou un "Non". Apporter une aide logicielle pour la préparation des
données serait un grand pas. L'élaboration d'un score est une affaire
d'expertise, de connaissance des données. La gestion des connaissances des
données est de plus en plus importante. Les spécialistes du scoring, qui
travaillent sur le passé pour essayer de voir dans le futur, sont obligés de se
pencher sur des données telles qu'elles étaient stockées à l'époque. Mais,
entre-temps, les règles de stockage ont pu changer. Dans un questionnaire
d'adhésion, par exemple, il y a aujourd'hui plus d'options de réponses à la
même question. Les modèles doivent ainsi être valables pour le moment présent,
mais aussi dans un futur proche. Attention donc à l'évolution du mode
d'alimentation.
Des méthodes plutôt classiques
Côté
technique, le scoring est basé sur des méthodes classiques et qui n'évoluent
que très peu, d'un point de vue mathématique. En revanche, les possibilités
d'évolution se trouvent dans leur application pour réaliser des analyses
complexes. Et là, toutes les possibilités ne sont pas encore explorées. Quand
il n'y a que deux modalités de réponse, elles produisent une seule note et
l'analyse est assez simple. Mais, avec des questionnaires à réponses multiples,
il faut appliquer des méthodes multiprédictives, pour élaborer des modèles sur
plusieurs axes. « Les méthodes multiprédictives sont assez développées dans la
médecine, pour étudier la probabilité des différentes pathologies. Elles sont
peu utilisées dans le marketing, sinon pour le secteur des voyages », constate
Mahamoud Azihari. La Banque de France utilise l'analyse discriminatoire pour
traiter des variables explicatives continues, comme le chiffre d'affaires et le
ratio de solvabilité dans l'analyse de risque de faillite. American Express
fait appel aux régressions logistiques binaires pour prendre en compte des
variables continues ou découpées, quantitatives et qualitatives. « La technique
des "réseaux de neurones" est utile quand il s'agit de faire du prédictif sans
explication. Par exemple, juste savoir que telle personne a une probabilité
élevée de dire oui à la proposition, sans comprendre pourquoi », explique
Mahamoud Azihari. Quelle est la fiabilité d'un score ? Cette méthode
mathématique consiste à trier les futurs clients du plus au moins probable. La
fiabilité, ici, n'est pas liée à la technique de tri, mais dépend de l'analyse
marketing préalable. Pour élaborer une bonne méthode, il faut déterminer
l'ensemble des critères qui distinguent le client du non-client. On va associer
une note suivant la profondeur d'information que ce critère apporte. Le
meilleur segment du score correspond souvent à 6 ou 7 % de l'ensemble. Il peut
assurer un taux de retour trois fois supérieur à la moyenne. Par exemple, dans
les assurances-vie et suivant le critère d'âge, un foyer de plus de 55 ans peut
avoir une note de 20, tandis qu'un foyer de moins de 30 ans aura une note de
10. Les premiers seront bien plus proches des produits d'assurance-vie. Mais il
ne faut pas considérer la note elle-même comme une distance chiffrée entre ces
deux types de clients.
Les limites du score ?
« On
prend comme hypothèse que ce qui s'est passé va se reproduire. Or, c'est de
moins en moins vrai, surtout par rapport à l'apparition de nouveaux types de
produits, constate Anne Gayet. Les marchés évoluent très vite, il faut pouvoir
s'adresser au passé récent et ne prévoir qu'un futur très proche, sans aller
au-delà. On nous demande de quantifier le futur taux d'achat de produits. Le
score ne sait pas répondre à cette demande. » Le score de volatilité permet de
hiérarchiser les clients. Mais il ne répond pas à la question "Combien de temps
mon client va-t-il rester ?". Ce n'est plus le score, mais des modèles de durée
de vie qui doivent y répondre. Le but du score est de faire changer le
comportement du client, or cela raccourcit la durée de vie des modèles. Quels
sont les secteurs concernés par le scoring ? « Parmi nos clients, le scoring
est surtout utilisé par les banques pour des besoins marketing et par des
distributeurs pour des problèmes de fidélité, par les opérateurs télécom et les
fournisseurs d'accès internet, pour des analyses du phénomène d'attrition »,
confirme Gilles Venturi. Les assurances-vie, la vente par correspondance, le
crédit à la consommation, le caritatif comptent parmi les secteurs demandeurs
de scoring. En revanche, certains marchés, comme l'automobile, n'y font pas
appel. Les professionnels du secteur automobile ont accès aux immatriculations
des véhicules. Pour eux, il est plus facile d'étudier ces renseignements plutôt
que de faire du scoring. Et, de manière générale, pour les secteurs qui
communiquent à la télévision, le score n'a pas grand sens. Le domaine bancaire
a été parmi les premiers utilisateurs du scoring. Ici, il n'y a que peu de
problèmes liés à la structure des données. Les informations sont quantitatives,
observées ou parfois déclaratives. Et, encore très souvent, on demande au
client des justificatifs de ses déclarations. Les différences entre un client
nouveau et un client existant sont dans la nature des informations. Dans le
premier cas, il s'agit de données obtenues grâce à un partenaire ou bien de
données déclaratives contrôlées. Dans le deuxième cas, ce sont les informations
de l'historique client. Dans le premier cas, la problématique est liée à
l'attribution d'un crédit, à l'ouverture d'un compte, à la délivrance de cartes
bancaires. Dans le deuxième cas, la problématique est à peu près la même, mais
les informations sont plus riches. Et, en plus, il faut analyser des problèmes
de décision de paiement, des actions par rapport à un dépassement de
l'autorisation, à des débits supérieurs. Dans le cas d'un recouvrement, il faut
optimiser l'action sur les impayés. Doit-on envoyer une lettre de relance ?
Ouvrir un contentieux ? Le type d'action sera décidé en fonction du
comportement du client. Idem pour définir un montant de découvert, délivrer une
carte bancaire à débit immédiat ou différé, ou pour proposer une montée en
gamme de produits. Le Crédit Agricole, par exemple, utilise le scoring pour
cibler l'envoi des mailings aux clients qui seront intéressés par l'offre, tout
en minimisant le risque. Il s'agit de placer des produits classiques ou
revolving. Le taux de retour est alors supérieur à 10 %, soit le double de ce
qui se pratique généralement. Et le risque est maintenu à un niveau constant
par rapport aux conditions habituelles.
Et sur le Web ?
Le besoin d'approfondir les analyses scoring dans le domaine
bancaire a encore augmenté depuis l'apparition des commissions Neiertz sur le
surendettement. Il a fallu inclure dans les analyses la situation
"surendettement" comme une situation transitoire entre le bon et le mauvais
payeur. On a beaucoup parlé de scoring à l'époque du développement du commerce
électronique. On pensait qu'il serait possible de faire du marketing
personnalisé en ligne d'après le profil du client, se basant sur deux ou trois
questions pertinentes. En effet, il est possible aujourd'hui de créer des
scores à partir des données sur Internet avec des logiciels comme Vignette.
Mais faut-il le faire ? « Souvent, la mise au point d'un scoring pour le
commerce électronique coûte plus cher que le résultat attendu et le gain
escompté », observe Thierry Vallaud. Tandis qu'en marketing direct classique,
le scoring et la segmentation s'amortissent très bien. « Nous ne pratiquons pas
le score en ligne sur des sites internet pour des ventes aux particuliers,
uniquement pour des entreprises », précise Sylvain Chamley. La raison est qu'en
France, on ne peut pas refuser une offre en ligne sur un site, il faut que la
demande soit analysée par une personne. En revanche, il est possible de faire
de la tarification en ligne. Experian l'a mise en place pour une filiale
assurance de Fiat. En dehors de quelques applications de ce type, l'offre de
score en ligne reste purement virtuelle.