II - Les métiers de la donnée
À LIRE AUSSI
- Nouveaux paramètres
- I - Le marché de la donnée
- III - Tour d'horizon de l'offre
- IV - Bâtir son plan fichiers
- V - Le traitement informatique de l'adresse
- VI / Etudes et analyses
- Nouveaux paramètres
- I - Le marché de la donnée
- III - Tour d'horizon de l'offre
- IV - Bâtir son plan fichiers
- V - Le traitement informatique de l'adresse
La concentration récente du marché et la présence de sociétés proposant une multitude de prestations rendent de plus en plus mince la frontière entre les différents métiers de la donnée. Les brokers proposent du conseil, les gestionnaires de bases font de l'hébergement.. Panorama des principaux métiers.
A - Les propriétaires et producteurs de données
Etre propriétaire d'un fichier n'est certes pas un métier en soi. Néanmoins, posséder et gérer sa propre base de données représente une activité à part entière. A côté des propriétaires, on trouve les producteurs de données qui constituent des bases à partir de fichiers existants.
A - 1. Les propriétaires de fichiers
Définition
De par leur activité, les propriétaires de fichiers disposent d'une base de données et cherchent à en faire une source de revenus supplémentaires. Le propriétaire de la base peut choisir de louer ou de vendre son fichier en direct, ou alors, dans la majorité des cas, de passer par un courtier en fichiers.
Champ d'application
Pour pouvoir commercialiser sa base, le propriétaire de fichiers doit l'entretenir, autrement dit la gérer, l'alimenter, la nettoyer et l'enrichir. Pour ce faire, il passe éventuellement par un prestataire spécialisé dans la gestion de bases de données. Si toutes les entreprises disposent de fichiers clients et/ou prospects, certaines ne souhaitent pas commercialiser cette matière première. Toutefois, cette tendance à vouloir conserver absolument sa base est moins en vogue. En effet, les sociétés propriétaires sont de plus en plus tentées de confier tout ou partie de leur fichier à des prestataires chargés de les commercialiser dans les meilleures conditions.
A - 2. Les producteurs de données
Définition
Les producteurs de données commercialisent des bases existantes sous un nouveau jour. Les éditeurs de bases ne possèdent pas de fichiers mais valorisent des bases existantes. Leur rôle est donc de faire parler les données.
Champ d'application
Pour Arnaud Caplier, directeur général dAcxiom, il existe trois sortes de producteurs de données: «L'agrégateur de data - comme Appolinis ou Conexance MD - qui constitue des bases à partir de fichiers existants; l'éditeur de bases, comme Acxiom, qui investit dans la collecte et/ou le traitement de la donnée; enfin, le troisième modèle correspond à la constitution d'un annuaire, type grandes écoles...»
Exemple
L'organisateur de salons Reed Expositions France commercialise, via Reed Data, sa propre base de données (deux millions de contacts) depuis 1995. Pour obtenir les données, Reed Expositions collecte les informations à l'entrée des salons ou lors du pré-enregistrement sur Internet. La banque de données visiteurs est hébergée et traitée chez Sogec, qui se charge notamment de la restructuration, normalisation et validation postale, de la mise au format des adresses, de la déduplication, de la sirénisation, du traitement de déménagés, des NPAI, etc. Soft Computing se charge, quant à lui, du traitement des visiteurs étrangers. Reed a choisi de ne faire ni échange, ni vente de données, comme l'explique Cathy Chipot, responsable BDD chez Reed Data: «Notrebase constitue notre fonds de commerce et nous sommes très vigilants sur son utilisation.» En tant que responsable de la base, Cathy Chipot intervient sur sa gestion en partenariat avec Sogec, sur les contrats avec les prestataires (GL Data Systems et Pluriel pour la saisie de données) et la réalisation du plan fichiers avec les responsables marketing.
B - Les brokers en fichiers
Définition
Le broker, également appelé courtier, loueur de fichiers voire agence média, propose aux annonceurs des fichiers d'adresses (postales, téléphone, e-mails...) qui répondent aux objectifs de leurs campagnes.
Champ d'application
Les courtiers côtoient de nombreux annonceurs (propriétaires de fichiers et partenaires) qui leur donnent une vision globale et pointue du marché. Ils recherchent les meilleures bases et établissent le plan fichiers. Les brokers sont rémunérés par une commission versée par les propriétaires de fichiers. Son montant représente entre 10 et 40% du prix de la location. Les brokers interviennent aussi dans la mise en place de partenariats ou d'échanges de fichiers entre les annonceurs.
Quant à l'achat de fichiers, il reste encore très rare et ceci pour deux raisons: d'une part, les annonceurs souhaitent disposer d'adresses «fraîches» (la location permet de bénéficier de données non utilisées) et, d'autre part, l'achat d'une adresse coûte trois fois plus cher qu'une location. Quant aux propriétaires de fichiers, ils se montrent frileux à l'idée de vendre leurs bases.
Le broker doit avoir une excellente connaissance du marché, une grande sensibilité marketing ainsi qu'un sens aigu du relationnel. Il doit disposer d'une base exhaustive de fichiers tenue à jour. En outre, le courtier dispose généralement d'outils de comptage en temps réel sur ses bases, de manière à répondre rapidement aux demandes de ses clients, ainsi que d'outils de gestion de campagnes multifichiers (lorsque la campagne est diffusée sur plus d'une dizaine de fichiers simultanément).
Evolution
Avec l'augmentation de l'offre et l'apparition de nouveaux acteurs, les brokers ont cherché à se différencier en développant de nouvelles prestations, surtout du conseil. Il est désormais proposé par tous les prestataires et n'est quasiment jamais facturé. Le conseil ne se limite pas aux plans fichiers. Les brokers apportent aussi leur aide sur le choix des prestataires pour le traitement de l'adresse, l'hébergement, l'analyse des campagnes... voire la réalisation elle-même. «Le broker qui dure et garde ses clients, c'est celui qui fournit du conseil. Beaucoup de courtiers l'ont bien compris», note Annie Martin, fondatrice dAnnie Martin Conseil.
C - Gestionnaires et hébergeurs de base de données
L'hébergement des bases de données consiste, comme son nom l'indique, à héberger le fichier sur une plateforme et à sécuriser les données. Aujourd'hui, les bases sont consultables par le propriétaire via une interface web en mode ASP afin d'intégrer de nouvelles données, de réaliser des extractions, des statistiques...
Champ d'application
Aujourd'hui, les prestataires spécialisés en gestion de base de données et traitement informatique de l'adresse proposent également l'hébergement des bases. Mais certains annonceurs, comme ceux de la Banque-Assurance par exemple, préfèrent héberger leurs bases en interne, contrairement à d'autres secteurs comme les associations caritatives ou les groupes de presse qui, eux, ont été les premiers à externaliser l'hébergement de leurs bases.
La gestion de la BDD comprend deux grands volets: le traitement des données et le traitement informatique de l'adresse (TIA). Le traitement des données prévoit l'enrichissement et la segmentation de la base afin d'optimiser le ciblage. Le TIA, quant à lui, intègre la suppression des doublons et des NPAI, le traitement des déménagés, la restructuration, la normalisation postale... Arnaud Caplier, directeur général d Acxiom, synthétise ainsi: «Le gestionnaire de la base s'assure de la qualité de la donnée, l'organise, puis la rend exploitable et accessible.»
D - La saisie de données
Avec le développement des technologies numériques, le métier de la saisie a beaucoup évolué. Les spécialistes du marché dématérialisent les documents, saisissent les informations et assurent la normalisation et l'enrichissement.
Définition
Les sociétés spécialisées dans la saisie de données, telles que Fedaso ou Vivetic, se chargent de saisir les données émanant de coupons, de cartes de fidélité... Souvent, leur prestation comprend aussi la normalisation des adresses et l'enrichissement des données.
Champ d'application
La première étape de la saisie prévoit la numérisation des documents, puis leur transfert vers les opérateurs chargés de saisir les données. Des logiciels analysent et identifient les réponses des clients. Lorsque la reconnaissance automatique ne fonctionne pas, les opérateurs interviennent manuellement dans la saisie des informations. Ensuite, ils procèdent à la normalisation, puis au dédoublonnage de la base. Enfin, les données sont cryptées avant d'être envoyées à l'hébergeur de la BDD. «Le métier de la saisie comprend, outre la saisie bien sûr, la collecte, la normalisation et l'enrichissement», explique Kristian Laratte, directeur associé de Vivetic.
Evolution
La saisie manuelle des données est bel et bien révolue. Même si l'intervention humaine reste indispensable à certains moments, le métier de la saisie est aujourd'hui très largement informatisé et permet aux annonceurs d'accéder plus rapidement aux informations.
E - Le data management
Informaticien, statisticien ou marketeur, le data manager est responsable de la base de données et travaille avec les services marketing, commerciaux, financiers et la direction générale.
Définition
Le métier de data manager diffère selon qu'il est exercé chez le propriétaire de fichiers, chez le prestataire ou en agence. Il consiste à gérer toute la chaîne de la donnée: stockage, exploitation, restitution, extraction, rapport...
Champ d'application
Chez l'annonceur, le data management garantit la qualité des données et intervient dans les opérations liées à cette donnée. Le data manager opère le lien entre la BDD et les différents services de l'entreprise. De plus, chez les prestataires, comme WDM ou Cegedim, le data manager gère la base de données pour le compte d'un client et sa mission comprend deux volets. Le premier est commercial: le data manager fait le lien direct avec son client. Le second est fonctionnel. Ce volet recouvre la partie de gestion de la base de données proprement dite. Enfin, au sein d'une agence de marketing services, la fonction porte sur une vision globale des données qui va au-delà de la simple gestion de la base au sens strict (RNVF? traitement des déménagés, déduplication...).
Evolution
Le data management se rapproche peu à peu de l'exploitation stratégique pure. A terme, les responsables de la donnée ne seront plus des informaticiens avec une appétence marketing, mais des statisticiens, experts du marketing avec des connaissances métier dont le rôle sera de modéliser les problématiques de l'entreprise.
JURIDIQUE
Brigitte Misse, avocat auprès de la cour d'appel de Paris
Les métiers et le droit Les propriétaires de fichiers
Ils sont généralement à l'origine du fichier. Au sens de la loi informatique et liberté, ils sont généralement considérés comme les responsables de traitement et de ce fait, responsables pénalement tant des données que des traitements effectués. Au sens du code de la propriété intellectuelle, ils peuvent être qualifiés de «producteurs de la base de données», au sens juridique du terme, dans le cas où ils prennent l'initiative et le risque des investissements correspondants.
Les hébergeurs, prestataires de saisie, sociétés de facilities management
Ce sont des prestataires de services. Au sens de la loi informatique fichiers et libertés, ils sont souvent désignés comme sous-traitants. Ils sont dès lors dans l'obligation de suivre les instructions écrites du responsable du traitement et de conclure un accord avec celui-ci. Au sens des relations contractuelles, ils peuvent être responsables des prestations confiées, vis-à-vis du client, dans le cadre d'une obligation, soit de résultat soit de moyens. Enfin, eu égard aux dispositions du code du commerce, ils sont dans l'obligation de disposer de tarifs et de conditions générales de services.
Les brokers
Il s'agit des intermédiaires entre les propriétaires de fichiers et les clients. Envers les clients, les courtiers sont tenus d'une obligation de conseil pour leur permettre de disposer de fichiers conformes à leurs besoins et à la réglementation. Vis-à-vis du propriétaire du fichier, ils restent responsables de la bonne commercialisation du fichier à titre exclusif ou non.
Le data manager
Il peut être également considéré comme responsable du fichier au sens de la loi Informatique, fichiers et libertés dans l'hypothèse où il définit lui-même les traitements et finalités dudit fichier.
A noter: Mettre à jour les données s'impose à tout responsable de fichier. Cette année, la Cnil a sanctionné une entreprise de télécommunications qui, dans un premier temps, avait refusé le droit d'accès d'un internaute puis, dans un deuxième temps, l'envoi incomplet de données.
Contact: brigitiemisse-avocat@orange.fr
AVIS D'EXPERT
Roland André, président du SNCD
La protection du consommateur, risque ou opportunité?
Depuis de nombreuses années, la protection du consommateur est au coeur des préoccupations des professionnels du marketing direct et le SNCD a toujours mené, au travers de ses différents guides de déontologie, un travail de fond sur ce sujet en collaboration étroite avec l'UFMD et la Cnil.
Aujourd'hui, le paysage change avec l'explosion d'Internet qui a notamment eu deux effets sur la protection du consommateur. D'abord, le Web facilite la collecte de données et accroît la volumétrie des données collectées. Ensuite, les forums et les réseaux sociaux sont de formidables lieux de discussion pour les consommateurs, qui deviennent de plus en plus acteurs du marketing des annonceurs.
Il est donc nécessaire d'intégrer ces nouveaux comportements dans la politique de protection du consommateur, ne serait- ce que parce qu'ils modifient le comportement des pouvoirs publics. En France, le Conseil national de la consommation (CNC), qui regroupe des représentants d'associations de consommateurs et usagers ainsi que des représentants des professionnels, rédige actuellement un rapport sur la protection des données du consommateur en association avec la DGCCRF, le Medef et la Cnil. Cette note, qui sortira d'ici à la fin de l'année, donnera des indications et des pistes d'actions au législateur pour les mettre en oeuvre. En Allemagne, la loi sur l'opt-in postal vient d'être votée. Il s'agit de mettre en oeuvre la même politique sur le mailing que celle en cours sur l'e-mailing. Ce texte prévoit toutefois des régimes dérogatoires quand la protection du consommateur est renforcée, notamment par une plus grande transparence. Enfin, la Cnil, qui souhaite une réglementation précise sur le ciblage comportemental on line, vient de publier un rapport sur le sujet.
Ces événements laissent penser qu'il existe un risque pour les métiers du MD mais, compte tenu de notre histoire et de la volonté de nos membres de développer leur business dans un cadre déontologique strict, nous pensons que la protection du consommateur est une nécessité et une belle opportunité de développement de la qualité de la relation client. Le SNCD travaille dans ce sens avec actuellement deux priorités.
La première est le ciblage on line, qui permet de personnaliser les contenus des offres publicitaires en ligne, les offres elles-mêmes et l'expérience client en fonction du comportement des internautes et de l'identification de leurs centres d'intérêt, tout en améliorant l'acceptation des publicités par les utilisateurs. Mais la collecte de données, anonyme ou non, suscite des craintes majeures dans l'opinion publique: peur des abus et de l'intrusion dans la vie privée. En l'absence d'information et de facilité d'opposition, les internautes risquent de rejeter les pratiques de ciblage dans leur ensemble, y compris les plus respectueuses des droits des individus. C'est pourquoi les professionnels travaillent dès à présent à l'établissement d'une charte de bonne conduite, véritable Livre Blanc du ciblage on line.
La seconde priorité est le fichier Robinson. Celui-ci permet à un individu de s'opposer à la réception de courriers publicitaires off line. Il existe depuis de nombreuses années et est utilisé par l'ensemble des acteurs du SNCD. Ce fichier, qui comptabilise 10000 à 12000 inscriptions par an, est un bon moyen pour protéger le consommateur, même s'il doit encore évoluer en étant notamment porté à la connaissance du plus grand nombre, chacun devant avoir le choix de s'y inscrire ou non. L'apposition de l'autocollant «Stop pub» sur les boîtes aux lettres est un bon thermomètre pour mesurer la volonté des consommateurs de ne pas recevoir d'informations publicitaires. Or, malgré une publicité très importante (écoles, mairies...), seuls 6% des foyers l'ont apposé.
Les consommateurs ne sont pas publiphobes, ils souhaitent recevoir de l'information publicitaire si elle correspond à leurs besoins et s'ils peuvent participer à la maîtrise des informations détenues par les annonceurs.
AVIS D'EXPERT
Olivier Coppet, membre de la commission études et technologie du SNCD, p-dg d'A.I.D.
La préparation des données, une étape- clé
La préparation du fichier à analyser continue d'occuper une grande partie du temps consacré à l'analyse data, même si la panoplie de méthodes proposées s'est considérablement étoffée. Les éditeurs de logiciels de data mining et les équipes de développement des grandes entreprises en réseau - dont la mission est de fournir aux équipes commerciales des outils d'analyse «presse-bouton» - proposent à présent des modules de préparation automatisée des data pour l'analyse. L'étape de préparation s'en trouve enfin facilitée, raccourcie et optimisée. Les données numériques, discrètes et textuelles peuvent participer conjointement à l'élaboration de modèles.
Par ailleurs, pour s'affranchir de certaines lourdeurs statistiques, les méthodes telles que les approches bayésiennes peuvent s'avérer très performantes.
Les nouveaux enjeux de l'analyse des data résident maintenant dans plusieurs directions. D'abord la vue «individu 360°». Il s'agit d'utiliser conjointement les données on et off line, de mesurer l'impact de l'ensemble des stimuli perçus par le consommateur (en particulier sur le Web où seul le dernier stimulus est souvent retenu), d'étudier en parallèle les comportements individuels et le comportement dans les groupes sociaux. Tout ceci ne va pas sans encadrer préalablement les conditions de stockage et de rapprochement des différentes sources de données privées concernées.
Autre direction: la visualisation interactive des data. Elle consiste à explorer visuellement des données dans un grand nombre de dimensions, de façon interactive afin d'accélérer la compréhension des phénomènes et de mettre en évidence la façon dont les données interagissent les unes sur les autres.
Dernière direction: l'analyse à plusieurs niveaux de données simultanément (mais nous n'y sommes pas encore...) ainsi que l'automatisation de la création et du test de tous les agrégats possibles. Tant que la plupart des méthodes statistiques s'appliquent à un fichier présentant en lignes les individus et en colonnes les «variables», le choix des agrégats (chiffre d'affaires sur un an, nombre de transactions sur x mois, délai depuis la dernière visite...) reste à l'appréciation de l'analyste. Pourtant, les agrégats possibles sont très nombreux et le risque de passer à côté des plus prédictifs est grand. Pour en générer automatiquement des milliers, voire des millions, et les tester, de grandes capacités de calcul sont nécessaires.
AVIS D'EXPERT
Valérie Papaud, directrice générale de PagesJaunes Marketing Services
La communication digitale et locale permet de resserrer les liens avec le consommateur
Le développement des canaux de communication digitaux engendre des évolutions importantes dans les métiers de la donnée. Avec le développement du digital, la collecte et le traitement de la donnée sont devenus des processus continus. La constitution et l'enrichissement des bases de données se font désormais au fil de l'eau, de façon automatique et non plus «par campagne». Il a fallu adapter nos outils de traitement pour collecter, traiter et analyser une somme d'informations de plus en plus conséquente, dans des délais de plus en plus courts, voire en temps réel.
La multiplication des canaux de collecte des données et des règles de gestion de chaque canal (opt-in, opt-out, total, partiel...) complexifie le traitement des données. Quant au on line, il facilite la collecte d'informations comportementales et enrichit automatiquement les bases de données en fonction de la navigation, de la réaction à une sollicitation d'un utilisateur sur son PC ou son mobile. Le métier de data miner évolue considérablement pour exploiter rapidement, de façon intelligente et opérationnelle, un tel volume de données.
L'aspect virtuel de la communication digitale peut éloigner l'annonceur du consommateur, la personnalisation des messages ne suffit parfois plus à recréer le lien qui existait entre eux dans une communication off line. L'annonceur doit développer une relation de proximité, d'où l'importance de la géographie dans une communication digitale et locale. Et c'est là que l'expertise développée par le passé autour de l'adresse postale retrouve toute son importance.
Forts de leurs connaissances dans le traitement de l'adresse postale, les prestataires doivent se doter de nouveaux outils pour collecter et traiter, parfois en temps réel, des volumes importants de données multicanal mais aussi développer leurs compétences en data mining et géomarketing pour permettre aux annonceurs de resserrer les liens avec le consommateur et ce, pour un meilleur ROI.