BIG DATA, BIG CHALLENGE
Nouveau défi des marketeurs, le «big data» consiste à traiter, en temps réel, de très gros volumes de données extrêmement variées et à les analyser. Toutes les entreprises sont concernées. Surtout celles qui possèdent de vastes gisements d'informations et souhaitent les passer au crible pour améliorer leur connaissance client et optimiser leurs campagnes.
Sommaire du dossier
- Fichiers clients et bases de données
- Vocabulaire de la base de données et de la gestion de fichiers clients
- Constituer une base de données
- Qualifier et enrichir sa base de données
- Analyser les données
- Les spécificités du B to B
- Gérer sa BDD
- Les métiers de la gestion de fichiers et BDD
- Juridique
- Bibliographie
Un formidable gisement à exploiter
Le déluge de données pousse l analyse un cran plus loin avec le big data. Toutes les entreprises anglo-saxonnes sont à l oeuvre. Leurs homologues françaises commencent à s y mettre. Leur objectif? Donner du sens aux va quantités de données non structurées émanant des clients.
Le Web 2.0 est entré dans les moeurs, les réseaux sociaux aussi, idem pour le cloud computing... Aujourd'hui, c'est au tour du "big data". «Tout est parti des grands acteurs du numérique, qui sont assis sur des gisements massifs de données», rappelle Alexis Mons, directeur général en charge de la stratégie de l'agence française Emakina. En analysant les informations fournies par leurs clients et utilisateurs, ils espèrent valoriser leurs services.» Ce n'est pas un voeu pieux: certains, comme Google, Amazon, Facebook et Yahoo!, ont déjà contribué à populariser les modèles de programmation open source MapReduce et Hadoop, conçus pour faciliter le traitement de très grands volumes de données sur des architectures web "distribuées".
Aujourd'hui, bien d'autres entreprises leur emboîtent le pas, aidées par l'augmentation continue des capacités de calcul et de stockage, mais aussi par la multiplication des outils informatiques permettant d'exploiter et de visualiser les données. Lesquels sont souvent des « versions industrialisées d'Hadoop, packagées pour les entreprises, telles Cloudera, MapR ou Hortonworks », indique Vincent Heuschling, fondateur du cabinet AffiniTech.
+ 40 %
CROISSANCE ANNUELLE DU VOLUME DE DONNEES PRODUITES DANS LE MONDE DE 2011 A 2020.
(SOURCE: MCKNSEY, MAI 2011)
UN STETHOSCOPE POUR ECOUTER LES BRUITS DE LA TOILE
Luca Paderni, analyste chez Forrester, explique que « la croissance du volume de données à gérer est exponentielle. Il faut bien sûr analyser tout ce qui se dit à propos de la marque sur le Web, les messages issus des réseaux sociaux et des forums. Mais on voit aussi de plus en plus arriver de nouvelles données provenant des voitures, des mobiles, des télévisions, des tablettes, des capteurs... Tous ces objets transmettent des informations qu'il faut apprendre à gérer. »
Cela ne va pas de soi. « On dit souvent que la difficulté réside dans les trois V: volume, vitesse et variété, souligne Isabelle Carcassonne, directrice marketing analyse décisionnelle chez IBM. On ne parle plus de téraoctets (1012), mais de «pétaoctets» (1015). Les data doivent être traitées en temps réel ; et surtout, elles ne proviennent plus uniquement de bases d'informations structurées car relationnelles, mais comportent aussi un nombre croissant de contenus non structurés, comme des commentaires, des vidéos, des images, de l'audio... » Pourquoi s'intéresser à ces données-là? « Si vous êtes un institut de recherche médicale, la possibilité d'accéder à des informations anonymisées sur la totalité des analyses de sang faites par un hôpital aura beaucoup de valeur pour vous », note Alexis Mons (Emakina). Vous pourrez effectuer des analyses statistiques et dégager des tendances. » L'examen des appréciations des clients peut s'avérer tout aussi précieux. « Une marque de lessive a utilisé une de nos solutions pour jauger la perception de son produit sur le marché», explique Isabelle Carcassonne (IBM). Après analyse de ce qu'il se disait sur la Toile, elle a découvert un problème d'odeur qu'elle méconnaissait et a revu sa formulation!» Un point de vue que partage le consultant en nouvelles technologies Xavier Dalloz. «Le «big data» permet de vérifier une intuition. Il faut poser les bonnes questions, puis vérifier, à partir de la masse d'informations, si votre idée repose sur du concret. » Un panel 2.0, en somme, sur lequel certains instituts de sondages comptent déjà s'appuyer.
Pour Hervé Tranger, directeur méthodes et process de BVA, le «big data» a pu émerger grâce au développement de deux types d'outils: « Ceux permettant d'écouter la Toile, pour récupérer les verbatims autour d'un sujet donné, et les logiciels d'analyse sémantique et de codification automatisée, pour structurer et analyser de gros volumes de verbatims. » Loin de concurrencer les études «traditionnelles», ces verbatims peuvent les compléter. «Ils ont facilité l'émergence de produits d'étude (e-réputation...), mais ont aussi enrichi les approches existantes», poursuit Hervé Tranger (BVA). Dans certains cas, le «big data» permet d'anticiper les difficultés pour améliorer le service client. L'éditeur français Scan & Target, dont les solutions sont utilisées par la Française des jeux et Pixmania, a développé un service en ligne d'analyse et de filtrage, en temps réel, des contenus générés par les internautes. Le club de basket américain San Antonio Spurs, un autre de ses clients, l'exploite, par exemple, pour modérer automatiquement sa page Facebook et détecter les fans qui peinent à se procurer des billets pour les matchs. «A chaque fois, nous alertons le community manager du club, qui contacte la personne pour l'aider ou pour lui proposer un produit répondant à ses attentes», relate Bastien Hillen, directeur général de Scan & Target.
ZOOM
Aéroports de Paris offre une boussole aux passagers
Le traitement des données, Aéroports de Paris (ADP) connaît! L'opérateur français gère une mine d'informations en temps réel sur les départs des vols, les arrivées et les bagages. Depuis plusieurs années, toutes ces informations sont instantanément restituées « dans un format lisible sur n'importe quel type d'écran », explique Olivier Tarneaud, directeur marketing produits et services d'ADP. Pour des besoins internes, bien sûr, mais aussi pour «fidéliser» les voyageurs qui « aiment être informés et maîtriser leur temps ». Aujourd'hui, le groupe va plus loin. Depuis juillet dernier, ADP propose My Way Aéroports de Paris, application gratuite de géolocalisation pour les mobiles utilisant le système d'exploitation Android de Google (des déclinaisons pour d'autres types de mobiles sont à l'étude). Objectif: permettre, grâce à des bornes wi-fi installées dans l'aéroport Paris-Charles de Gaulle (où les signaux GPS traditionnels ne sont pas accessibles), de localiser et de guider les utilisateurs dans les méandres des aérogares 2E et 2F, de leurs parkings et de la gare TGV avoisinante. « Cela facilite la vie des passagers et accroît donc leur satisfaction », souligne Olivier Tarneaud. Le système, conçu en partenariat avec la filiale Hub Télécom d'Aéroports de Paris et l'éditeur toulousain Pole Star, respecte l'anonymat. Il sera prochainement intégré à My Airport, l'application d'information en temps réel d'Aéroports de Paris, et pourra être utilisé avec d'autres types de données, par exemple sur les vols, les formalités, les bagages... Ce n'est pas tout. ADP envisage maintenant de créer des profils - optionnels, cette fois - pour communiquer des «informations commerciales ciblées» aux passagers. L'idée? « Diffuser rapidement la bonne information sur leurs enseignes préférées et les lieux d'intérêt », s'enthousiasme Olivier Tarneaud. La liste des possibles est longue.
OLIVIER TARNEAUD / DIRECTEUR MARKETING PRODUITS ET SERVICES D'AEROPORTS DE PARIS
« Toutes les informations utiles sont instantanément restituées dans un format lisible sur tous les écrans.
ZOOM
Yelp France sonde les profondeurs de l 'information locale
Créé en 2004 à San Francisco, le site de recommandation Yelp (58,4 millions de dollars de chiffre d'affaires en 2010) a déjà collecté 22 millions d'avis sur tous types de commerces de proximité et d'activités locales: restaurants, toiletteurs, brocantes, garages, piscines... Très active aux Etats-Unis, la société, qui prépare son introduction en Bourse, est aussi installée au Canada et dans huit pays européens, dont la France, où elle a posé ses valises en mai 2010. Quel que soit le pays, l'objectif consiste à «creuser au maximum dans les données liées au marché local et faciliter la recherche d'informations», précise Zeva Bellel, directrice marketing de Yelp France.
Yelp s'efforce de détecter des tendances, d'identifier les super-utilisateurs («la brigade d'élite») et de les convier à de petites réunions «dans la vraie vie», dans des lieux scrupuleusement choisis. Le 24 novembre dernier, les Parisiens ont ainsi été invités au café-torréfacteur Coutume Café, «l'une des adresses les plus recommandées actuellement dans la capitale», selon la directrice marketing de Yelp. Le décor ne devrait pas être le même à Lyon, où la petite communauté de Yelpers serait apparemment surtout friande de bagels. L'important? Fédérer une tribu de passionnés. Et pour Yelp? Choyer une audience très qualifiée, ce qui nécessite de modifier en permanence les outils de recherche et de filtrage des contenus. «Un algorithme secret détecte les contenus potentiellement suspects soumis par les Yelpers, précise Zeva Bellel. Ces contenus ne sont pas effacés, mais mis de côté pour ne pas nuire à l'information.» L'enjeu est de taille. Yelp génère la quasi-totalité de ses revenus avec les campagnes publicitaires menées sur son site par de grandes enseignes nationales et des commerces de proximité.
RECOUPER LES INFORMATIONS ET... RESTER HUMAIN
Reste que l'approche s'avère encore souvent compliquée. «Le «big data» ne se résume pas à un type de données, précise Bastien Hillen. Les réseaux sociaux sont un exemple, mais il en existe beaucoup d'autres. E-mails, appels téléphoniques aux services consommateurs, vidéos, SMS... sont d'autres canaux importants. Et aucun éditeur ne peut prétendre couvrir la totalité du «big data». » Quoi qu'en disent la majorité des acteurs qui se positionnent sur ce marché émergent, objet de nombreuses convoitises...
« Il serait presque illusoire de vouloir gérer la totalité des données », ajoute le consultant Luca Paderni.
L'idéal selon lui? « Identifier une quinzaine de points d'interaction prioritaires avec les clients. Les consommateurs se forgent une opinion sur votre marque à partir de ces points de contact. Pour chacun, effectuez de nombreux tests, évaluez les comportements et cernez ce qui a le plus de valeur. » Ce faisant, vous devriez identifier de nouvelles idées pour satisfaire les consommateurs. Mais attention à ne pas tout miser sur le «big data». « La technique aide à cerner des tendances ou des grilles comportementales, comme la quantité d'informations publiée par un internaute, le nombre de pages lues à chaque visite, le nombre de pauses... », affirme Romain Chaumais, directeur business intelligence de la société de services Ysance. Pour autant, nul ne peut être sûr à 100 % de la qualité des données et mieux vaut recouper ses découvertes avec d'autres informations. « Les données n'ont pas d'intelligence en elles-mêmes. Elles doivent être mises en perspective, insiste Alexis Mons (Emakina). On ne peut pas les détacher du contexte, des moyens ou de la qualité... » Le «big data» constitue un outil très précieux. Mais il n'est pas encore près de remplacer les analystes. Son développement devrait même créer de nouveaux métiers. « Il faut des experts pour veiller sur les sources, réaliser les bons échantillonnages... », assure le consultant Vincent Heuschling. Les têtes pensantes du marketing peuvent être rassurées.
BASTIEN HILLEN/SCAN & TARGET
LE «BIG DATA» NE SE RESUME PAS A UN TYPE DE DONNEES. LES RESEAUX SOCIAUX EN SONT UN EXEMPLE, MAIS IL EN EXISTE BEAUCOUP D'AUTRES.
Garantir l'anonymat
En France, lorsque des données réelles à caractère personnel sont utilisées pour des tests ou des développements, celles-ci doivent être rendues anonymes de façon irréversible, via des processus validés par des experts.
Récemment, la Commission nationale de l'informatique et des libertés (Cnil) a défini les bonnes pratiques de l'utilisation de données à caractère personnel pour la géolocalisation. Si les «informations issues de points d'accès wi-fi sont utilisées pour fournir des services», celles-ci sont considérées comme des données à caractère personnel au sens de la loi. Leur traitement doit donc être déclaré à la Cnil et «la conservation des données de localisation associées à un point d'accès wi-fi ne doit pas dépasser cinq ans». Concernant la géolocalisation sur téléphone mobile, la Cnil précise que la plupart des services actuels «intègrent des mécanismes permettant de définir précisément la diffusion d'informations de géolocalisation». Enfin, si «le marketing ciblé fondé sur de la géolocalisation n'est pas interdit», il faut «que les personnes souscrivant à des services ayant pour objet de localiser ses amis aient conscience de la possible réutilisation de ces données à d'autres fins et puissent s'y opposer».
ZOOM
Expedia ne lâche plus la main des voyageurs
« Nous nous sommes toujours concentrés sur les données, et cela va croissant », lance Maryse Gauthier, directrice marketing France, Belgique et Pays-Bas chez Expedia, quand on l'interroge sur l'importance du «big data». « Nous rassemblons des informations sur toutes sortes de choses: par exemple, sur l'heure de départ du vol du client, la disponibilité d'un sèche-cheveux ou d'un journal gratuit dans sa chambre d'hôtel... Avec plus de 3 millions de visiteurs par jour, nous disposons d'une grande quantité de données. » L'objectif du «big data» consiste, selon elle, à « utiliser ces informations pour proposer les services les plus pertinents possible ». Expedia s'est, par exemple, « aperçue que la majorité de ses clients utilisent leur mobile pour réserver un hôtel à leur arrivée ». L'entreprise a donc lancé, en mars 2011, une application mobile de réservation d'hôtels qui, en s'appuyant sur le GPS du smartphone de l'utilisateur, le géolocalise et lui fait gagner du temps. De même, l'analyse du parcours d'achat de millions d'utilisateurs du site a permis d'identifier les difficultés rencontrées lors de leur navigation et d'améliorer les processus de réservation ainsi que la présentation des informations. La principale difficulté reste, selon la responsable marketing, « d'analyser la valeur locale des jeux de données » Et de leur donner du sens.
ISABELLE CARCASSONNE / IBM Big data et marketing: l'autre diptyque de 2012
L'émergence du «big data» fait poindre, pour les directions marketing, un défi supplémentaire qui va rendre encore plus complexe l'exercice de leur métier. Le marketing s'apprête à vivre une rupture technologique due à l'explosion du volume de données disponibles, à leur extrême diversité (textes, photos, vidéos, son) et à leur exploitation en temps réel (analyse des données en millisecondes sur les marchés boursiers, détection de fraude instantanée au niveau des commandes de clients sur le Web, etc.). Or, faire l'impasse sur ce sujet serait préjudiciable:
- parce que le marketing a besoin de toutes ces données pour affiner ses campagnes ;
- parce que les réseaux sociaux alimentent le big data - ils génèrent, en effet, une masse de données non structurées et les marques ont beaucoup à y apprendre pour mieux connaître leurs clients ;
- parce que les actions marketing s'opèrent aujourd'hui en temps réel - avec le développement d'Internet à haut débit, de la 3G et de la démocratisation des terminaux mobiles, les clients sont connectés en permanence et multiplient les canaux pour communiquer avec les marques.
Conséquence: les directions marketing vont devoir se doter des moyens nécessaires à la maîtrise de toutes ces données, à leur analyse en temps réel et à leur transformation en atout stratégique. Y renoncer signifierait se contenter d'une connaissance parcellaire de ses clients, soit un désavantage notable sur des marchés devenus hyperconcurrentiels.
Chez IBM, nous anticipons ce mouvement depuis plus de cinq ans par l'acquisition de solutions logicielles - 24 entreprises rachetées moyennant 14 milliards de dollars, auxquels s'ajouteront 20 milliards de dollars investis d'ici à 2015. Déjà plus de 500 brevets ont été déposés sur les solutions d'analyse avancée qui explorent de nouvelles frontières de l'informatique.
Pour maîtriser le big data, les solutions de BAO combinent plusieurs savoir-faire technologiques comme les bases de données, la gouvernance de l'information, l'analyse décisionnelle, le pilotage, l'analyse prédictive et prescriptive, la gestion de contenu, les applications métier pour le marketing et la relation client. Ces technologies permettent de collecter, nettoyer, organiser, stocker et analyser les données structurées et non structurées, d'en tirer des enseignements, de disposer d'indicateurs et d'analyser les tendances, de générer et de gérer de nouveaux contenus, de les diffuser, les partager et d'absorber les retours des clients. L'objectif? Disposer d'informations pertinentes et fiables pour prendre les bonnes décisions.
Une première étape devra d'abord être franchie pour entrer dans le monde merveilleux du big data: analyser les données. Une étude publiée par la MIT Sloan School of Management et l'IBM IBV
Si les entreprises risquent de se heurter à l'absence de culture en matière de mise en oeuvre généralisée et transversale des solutions d'analyse, il est néanmoins urgent qu'elles s'emparent du sujet. Nul doute que les projets de «big data» et de BAO mobiliseront l'énergie des équipes dans les trois années à venir, en complément des projets concernant le développement de campagnes marketing personnalisées en temps réel sur les réseaux sociaux.
ISABELLE CARCASSONNE
45 ans, diplômée de Paris IX Dauphine, a exercé toute sa carrière autour des solutions de Business Analytics and Optimization (BAO). D'abord consultante, spécialisée dans le pilotage de a performance auprès de grand comptes industriels, elle a rapidement rejoint es éditeurs leaders de ce secteur: Comshare, Microstrategy Cognos et, désormais, IBM, où elle est directrice marketing BAO pour a France.