Recherche

DossierBig data, big opportunité mais big chantier

Tout ce que vous avez toujours voulu savoir sur le big data sans jamais oser le demander.

Publié par Thierry Derouet le
Lecture
23 min
  • Imprimer
Big data, big opportunité mais big chantier

1 Big data, big opportunité mais big chantier

Tarte à la crème, buzz planétaire ou réalité tangible ? Nous serions devant un déluge "informationnel" sans précédent. Et nous nous retrouverions bien incapables d'appréhender la tempête.

Le gros grain promis, c'est celui de la donnée. Et pas n'importe laquelle : celle qui concerne nos clients. Des clients qu'il ne faut plus seulement mettre au centre des réflexions et écouter. Des clients dont nous devrions anticiper les moindres faits et gestes. Mais cette révolution de consommateurs actifs sur les réseaux sociaux et surinformés lorsqu'ils franchissent le seuil de nos magasins mériterait un tout autre traitement que celui auquel nos manuels de marketing nous auraient préparés. Cette absence de prise de considération serait l'une des causes de la faillite de nos entreprises.

L'une des voies du changement passe par le big data. Mais quel est, au juste, l'enjeu ? Toutes les entreprises sont-elles concernées ? À quelle vitesse les entreprises peuvent-elles agir sur la donnée ? Pourquoi l'ambition est-elle belle et grande ? Est-ce réellement une révolution ?

L'affaire n'est pas nouvelle, mais prête à réflexion quant aux limites du big data. Elle remonte à deux ans. Un homme des environs de Minneapolis, visiblement remonté, est allé trouver le directeur d'un supermarché Target, bons de réductions en main pour divers produits destinés aux jeunes mamans adressés à sa fille. "Elle est toujours au lycée, et vous lui envoyez des bons de réduction pour des berceaux et des vêtements pour bébé ? Vous voulez l'encourager à tomber enceinte ?"

Quelle n'a pas été pas la surprise dudit directeur de magasin qui, préoccupé par sa mésaventure, a contacté quelques jours plus tard le père de famille pour lui renouveler ses excuses. C'est le père qui s'est excusé auprès du directeur : " J'ai eu une discussion avec ma fille. Il se trouve qu'elle a pris part à des activités sous mon toit dont je n'ai pas été pleinement informé. Je vous dois des excuses. "

La suite de l'histoire, médiatisée par le New York Times (*), éclaire autant sur les potentialités du big data que sur ses limites. Notre confrère du New York Times a rencontré, quelque temps après, le statisticien de Target, Andrew Pole, qui, dès 2002, a travaillé à la mise au point du modèle statistique incriminé.

Destiné à découvrir, avant tout le monde, quand une consommatrice est enceinte, le modèle d'Andrew Pole a permis de déduire que c'est pendant le deuxième trimestre de grossesse que la future maman effectue en général des achats pour le bébé à naître.

(*) "How Companies Learn your Secrets", par Charles Duhigg, publié le 16 février 2012.

Nous avons rencontré une partie des spécialistes du big data dans l'idée d'en comprendre les enjeux et les limites. Compte rendu d'une "quête" de vérité !

2 Un enjeu pour la création de valeur

Ces événements de la vie, comme une grossesse, un divorce ou un déménagement, changent les comportements d'achat des individus. On comprend, dès lors, l'intérêt pour une enseigne de grande distribution, ou autre, d'avoir une connaissance précise de ses clients. Elle est donc incitée à analyser massivement les données démographiques et historiques d'achat de millions de consommateurs.

La statistique fait donc des miracles ? Oui ! Mais peut être trop. Car Andrew Pole n'a pas seulement identifié une liste de 25 produits que les femmes enceintes sont plus susceptibles d'acheter. Il prétend deviner - à quelques jours près - à quel stade de sa grossesse la cliente se trouve quand elle passe en caisse. Les découvertes de ce statisticien vaudraient de l'or, le chiffre d'affaires de Target étant passé de 44 milliards de dollars en 2002, quand Andrew Pole a été embauché, à 67 milliards en 2012.

Revers de la médaille : la chaîne de magasins Target a été victime, fin 2013, d'un "braquage big data". Pas moins de 110 millions d'informations incluant noms, adresses postales, numéros de téléphone, adresses e-mail et coordonnées bancaires ont été subtilisés. Soit les données d'un tiers de la population américaine !

Cette histoire est à la mesure de l'enjeu. Nos entreprises doivent-elles y passer ou s'en passer ?

Face à la crise actuelle de la surconsommation de nos sociétés occidentales, l'approche consommateur se doit d'être ciblée, géolocalisée, personnalisée, reciblée. Pour paraphraser Michel Serres, nous sommes passés d'une société composées de générations qualifiées "d'X, Y ou de Z" à des populations seulement "connectées".

Conséquence : la relation humaine - et plus encore la relation commerciale - n'a plus désormais qu'une seule réalité, laquelle se traduit en collecte massive d'informations. De la récolte à l'analyse, en passant par l'exploitation, la data porte, en dépit de ses excès, de nouveaux espoirs. En espèces sonnantes et trébuchantes.

Ce "big" n'est-il cependant pas un peu flou, voire mal défini ? Créer de la valeur à partir de données est mieux que partir de rien. Mais, en l'espèce, c'est comme rechercher une aiguille dans une meule de foin. Et, en parlant d'en faire "tout un foin", nos analystes n'en feraient-ils pas trop ?

Dans une étude récente (*), IDC démontre, schéma à l'appui, qu'à brève et moyenne échéances, le big data induira au sein des entreprises françaises de plus de 500 salariés des transformations numériques importantes. Modifications qui vont non seulement toucher les métiers du marketing mais qui vont également les amener à rechercher de nouveaux talents.

Seulement voilà : que vont produire, en termes de valeur, ces brillants esprits ? Comme le rappelle Michel Bruley, en charge du marketing chez Teradata Aster, " selon Gartner, 85 % des 500 premières entreprises qui s'apprêtent à investir dans le big data d'ici à 2015 n'y trouveraient aucun avantage ". Ce ne serait donc pas l'eldorado tant attendu.

Pourtant, dans un rapport publié quatre ans plus tôt, le cabinet McKinsey prédisait (**) " une augmentation de 60 % de la marge d'exploitation des retailers qui utiliseraient pleinement ces énormes volumes de données ". Marc Salomone, directeur associé de Brand Advocate, est plus pessimiste sur la réalité de la big data, car selon lui " seul 1 % des entreprises a mis en place une stratégie de ce type ".

Bref, cette querelle de chiffres, puisque IDC table sur un chiffre d'affaires généré par le big data de 23,8 milliards de dollars en 2016 au niveau mondial, contre 8,9 milliards cette année (selon le cabinet Transparency Market Research) montre qu'il y a là une forte appétence.

(*) "How Companies Learn your Secrets", par Charles Duhigg, publié le 16 février 2012.

(**) Observatoire de l'évolution des métiers liés à la transformation du numérique. IDC France, janvier 2014. Enquête téléphonique réalisée auprès d'un échantillon représentatif de 225 décideurs métiers issus d'entreprises de plus de 500 salariés basées en France, dont 75 départements marketing.

Un secteur créateur de valeur pour l'entreprise. Mais à quel prix ?

3 Interprétation du Big Data

Teradata

Teradata

Michel Bruley

Le big data se résume-t-il à la seule définition des 5 V (volume, vitesse, variété, visibilité et véracité) ?

En la matière, le véritable "V" à retenir ne serait-il pas celui de la "vanité" ? Michel Bruley constate que travailler à partir de gros volumes de données n'est pas commun pour une entreprise. Sur les 1 150 clients que compte son entreprise, " seuls 30 font partie du club de ceux qui aujourd'hui manipulent des volumes dépassant le pétatoctet (NDLR : 1 pétaoctet équivaut à 1 024 téra­octets). " Et dans ce top 30, pas une entreprise n'est française.

Le "big" de la data n'est donc pas à la portée de tout le monde. Un à un, nous pouvons faire tomber les "5 V" de leur piédestal. Et Michel Bruley de rappeler que le fossé entre les entreprises françaises et américaines est immense. En effet, quand les grands distributeurs américains engrangent des données consommateurs sur des " séries temporelles de six à huit ans, les paniers de la ménagère française ne sont conservés que sur des périodes d'environ 65 semaines ". Marc Salomone enfonce le clou : " La moitié des marques n'exploite pas ses données correctement. "

Pourtant, les expériences vont bon train pour démontrer qu'il n'y a qu'à creuser pour trouver de la valeur. IBM a ainsi révélé, en collaboration avec France Télé­visions, qu'il était possible d'analyser en temps réel le sentiment des spectateurs de la 57e finale de l'Eurovision. Et de prédire 72 heures à l'avance à partir de 710 000 tweets et de 255 000 articles de blogueurs en 56 langues les trois finalistes et le gagnant. L'exploit ce n'est pas tant ici l'enjeu de l'élection mais la capacité à déployer une plateforme big data en trois semaines, le tout avec un budget présenté comme "limité".

De manière pragmatique, la démarche big data est essentiellement employée sur des modèles d'attrition afin de savoir, par exemple, comment retenir et rattraper ses clients. Les opérateurs téléphoniques en seraient ainsi friands. La grande force du big data serait toujours, selon Michel Bruley, de " s'attaquer à des données qui, jusque-là, n'étaient pas travaillées en corrélant la qualité d'un service de télévision fourni par un fournisseur d'accès à Internet " à un client mécontent. Mais, pour y arriver, " parfois, 60 sources différentes sont nécessaires pour avoir une bonne connaissance client ". Le "V" de la variété est donc bien présent, mais il donne parfois le vertige.

Michel Bruley invite les entreprises à se montrer pragmatiques. Travailler ses données digitales a permis au groupe financier Wells Fargo de découvrir - à l'instar d'un opérateur télécoms suisse - " qu'il dépensait trop d'argent en achetant des mots-clés sur Internet ". Toutes les données, à condition d'avoir une idée précise de ce que l'on recherche, apportent du sens. Et parfois, le ROI est au bout de la pelle d'une action big data ! Mais pas toujours.

L'expert Marc Salomone - Brand Advocate

Déclencher des opportunités business

Marc Salomone, directeur associé chez Brand Advocate, propose de revenir à des fondamentaux pour affronter le phénomène big data. Il est stupéfait de voir que l'on puisse répondre à des appels d'offres big data en " abordant une compétition sur le coin d'une table ". Marc Salomone propose une approche fondée sur "le brand profiling", une philosophe assez simple où ce qui est mis en avant est " l'humilité d'aller voir ses clients ".

Une méthode articulée selon trois principes : une vision interne (interview des acteurs-clés au sein de l'entreprise), et une vision business, fondée sur la récupération de l'ensemble des données que l'on peut collecter afin d'analyser les clients et leurs habitudes de consommation. Avec pour objectif la mise en place de scores d'appétence destinés à optimiser, par exemple, des budgets pour segmenter, activer, fidéliser... Le tout repose sur des techniques statistiques qui s'appuient sur l'analyse de plusieurs années d'activité.

Enfin, une vision client. Marc Salomone ne croit pas aux focus group car pour lui, l'achat d'une marque est irrationnel. Et de préférer faire parler les clients sur les " relations à la marque " pour avoir de vrais insights. Car pour lui " le big data passe par la connaissance client, ce n'est pas de l'art pour l'art, car ce qui est déterminant, c'est de déclencher des opportunités business ".

Où est la vérité ? Ne s'agit-il pas simplement d'une divergence de définition ?

4 Un enjeu pour les hommes

Pourquoi, alors, cela coince-t-il côté marketing ? L'acculturation serait grande : travailler son big data revient seulement à utiliser autrement les données. C'est-à-dire à réfléchir en dehors des sentiers battus des requêtes dites "SQL", en d'autres termes, structurées.

Cette révolution implique de travailler et de croiser des données qui - comme nous l'avons évoqué - n'étaient jusqu'ici jamais exploitées. Sauf par les géants du Web qui, depuis ces dix dernières années, en ont fait leur cheval de bataille, à l'image d'Amazon, de LinkedIn, d'eBay et, bien entendu du champion, en la matière : Google ! Bruno Teboul, en charge de la recherche chez Keyrus, qualifie de " multistructuré " l'or numérique à traiter. Et d'insister sur un fait : " Nous sommes à l'aube de la science des corrélations. "

Nous sommes donc confrontés à une complexité inattendue pour les organisations. Si le phénomène du big data impose aux directions générales de revoir les stratégies pour en saisir les opportunités de business, il entraîne également une réorganisation structurelle importante de l'entreprise. À tous les niveaux, et en particulier entre les directions marketing et les directions informatiques (DSI). Dialogue et collaboration doivent donc s'installer pour faire un bon usage de ces données. Et Jérôme Besson, directeur associé de Sentelis de nous inviter à être patient car " pour pouvoir passer d'un pilote big data (proof of concept, ou POC) à l'industrialisation, il faut s'assurer que la DSI et les métiers grandissent ensemble sur le sujet, c'est-à-dire qu'ils se parlent le plus tôt possible ".

Au sein de Microsoft, Damien Cudel, en charge du marketing produit des solutions dédiés à la business intelligence, insiste sur le fait que " la big data met en place une relation conflictuelle entre la DSI et les métiers ". La solution consisterait à " déplacer les débats, être agile et donner la main aux porteurs de projets, quitte à outsourcer pour créer le POC ". Toujours selon Damien Cudel, " un projet big data réussi, c'est une core team constitué d'un statisticien, d'un profil IT et du métier qui va avoir la curiosité business ".

On est donc loin des profils uniques de type data scientists, dont McKinsey estime le besoin aux États-Unis à 500 000 et en Europe à 200 000. La sensibilité nécessaire serait donc aussi et surtout "business". Ce serait donc aussi à nos professionnels du marketing de s'y coller ! Et cela ne semble pas illogique.

Le big data au coeur d'une activité marketing et en quête de talents.

Le big data, un enjeu de société

La mésaventure de notre jeune fille, relatée en début de dossier, met en lumière l'enjeu sociétal que pose le big data. D'autant plus que cette collecte ne s'effectue pas que sur les individus. Elle concerne également l'ensemble des données publiques.

L'action aujourd'hui dirigée en France par Henri Verdier au sein d'Etalab a pour vocation d'accélérer la mise à disposition d'une famille d'informations gratuites estimées à plus de 350 000, lesquelles sont organisées sous la forme de "jeux de données". Les données publiques sont variées et concernent aussi bien l'État que les collectivités locales. Les éléments de la vie de tous les jours y figurent également : points d'intérêt, liste des prénoms recensés au sein d'une commune, arbres ­remarquables...

Bref, nous décrivons notre société sous la forme de données. Nous sommes ici au coeur du big data public. Ces données ont pour vocation d'être croisées librement avec d'autres collectées à des fins privées. Ces dernières, nous l'avons vu, peuvent poser directement ou indirectement préjudices aux personnes concernées.

Nous n'allons pas ici entrer dans le champ juridique car les données, comme leur usage, bénéficient normalement de nombreuses protections et de tout un ensemble de dispositifs légaux (droits d'auteur, concurrence déloyale, contrefaçon des droits de la propriété intellectuelle, protection de la vie privée...) résumé parfaitement par l'avocat Gérard Haas dans un Livre Blanc récemment publié et intitulé "Marketing digital : loi, confiance et performances" (*).

Mais est-ce suffisant ? Bernard Ourghanlian, directeur technique et sécurité de Microsoft France, aimerait que l'on n'oublie pas " la responsabilité de celui qui manipule le big data ". Pour lui tous les acteurs doivent " adhérer au principe d'éthique et de responsabilité ". Toutefois, notre spécialiste de la sécurité constate qu'il existe un énorme vide juridique. " La logique du consentement initial a explosé. " Et d'inviter les politiques à trouver des sanctions, sans lesquelles tous les excès seront permis.

Car nous n'aurions encore rien vu ! " Vis-à-vis du public, la transparence est aussi le meilleur gage que ces données puissent être valorisées sans que cela provoque un rejet ", note Jérôme Besson. Toutefois, les initiatives concernant la transparence des données sont hélas bien faibles, comme celle proposée en Angleterre avec Midata et en France avec MesInfos (**). Mais c'est un sujet sur lequel un marketeur ne pourra à l'avenir plus faire l'impasse. Sauf à risquer d'anéantir la relation de confiance engagée avec ses clients. Vous voilà prévenus !

L'expert Arnaud Massonnie - Fifty-five

Réconcilier les données digitales avec les données off line

Arnaud Massonnie, cofondateur et directeur général de la société Fifty-five, est au coeur du développement produits de son entreprise. Entrepreneur dans l'âme, il a à son actif un brevet et trois start-up internet, dont un passage chez Google. Son ambition est de " décomplexifier une direction marketing sur l'activation data ". Ce qu'il propose à ses clients, c'est de " travailler son ordonnancement produits ", " de travailler son média ", " d'adapter le CRM au datamining ".

Pour lui, le " big data est une promesse de valeur d'usage ". Mais pour y arriver, il faut selon lui disposer aussi bien d'une expertise métier que d'une très bonne connaissance technologique. Et de résumer ce qu'il propose par une promesse simple : " Enrichir la connaissance utilisateur pour améliorer le parcours client. "

Selon Arnaud Massonnie, la réussite d'un projet big data implique " d'être modéré dans l'ambition de ses projets ". Et de mettre le doigt où ça coince chez ses clients, car souvent, " on est au début de la fin des silos du off line et du on line ". Pour accompagner la transformation digitale des entreprises, il faut définir des cycles d'accompagnement avec des projets. Et surtout, ne pas oublier qu'un projet doit " aboutir à un bon pilotage des données business ". Ce n'est qu'après qu'il est possible " d'aller un cran plus loin ". Il ne s'agit tout de même pas de partir d'une page blanche : " Le débat porte sur l'expertise et les outils associés pour enrichir ou compléter l'écosystème technologique de nos clients. " Et de rappeler que " le digital est un outil fantastique pour l'analyse des données marketing ".

(*) Réalisé par Jean-Paul Lieux, cofondateur de Dolist, et Gérard Haas, avocat à la Cour.

(**) L'initiative MesInfos, de la Fing (Fondation internet nouvelle génération), propose à un petit nombre d'entreprises et d'administrations pionnières d'expérimenter ce qui pourrait constituer la base d'une transformation profonde de la relation entre les organisations et leurs clients ou usagers : le partage et la réutilisation des données personnelles avec les individus qu'elles concernent.

Une nouvelle relation entre l'homme et ses données.

Des outils mais surtout des méthodes

Dans cette histoire de big data, un marketeur ne se trouve-t-il pas comme une poule devant un couteau suisse quand il est question des outils pour passer à l'action ? Comme toujours, dans ces histoires à valeur hautement technologique, c'est là que l'on parle "gros mots" : NoSQL, Hadoop, MapReduce, BigTable, Cassandra, Storm, Kafka, Voldemort... Autant de termes qui désignent la même chose : des technologies big data. Mais devons-nous les évoquer et confondre l'outil avec l'usage ?

Chez Brand Advocate, Marc Salomone préfère parler de " brand profiling ", c'est-à-dire d'une " philosophie où l'on se pose des questions avant de se donner des réponses ". Et plutôt que d'attaquer la donnée, Marc Salomone préfère avoir " l'humilité d'aller voir qui sont ses clients pour y constater ce qui marche et ce qui ne marche pas ", puis " d'analyser les clients et leurs habitudes de consommation ". Sommes-nous dans une action de big data, de small data, de smart data ? Bernard Ourghanlian, pour sa part, préfère évoquer le " all data ". Et Marc Salomone de rappeler que parfois, ce que l'on recherche est sous nos yeux : " La Madeleine de Proust n'a pas de prix. "

Le terme "big data" relèverait ainsi d'une mode. Mais pas la démarche qui l'accompagne, laquelle est, pour Marc Salomone, " une vraie évolution dans le marketing ". Il invite à " faire du smart et de la data avant de faire du big ". Et préciser : " Techniquement, on sait tout faire. Mais quels sont les moyens, la stratégie et les objectifs ? L'investis­sement ? Il est nécessaire de voir ce que l'on fait de la donnée. "

Chez Fifty-five, même discours de la part d'Arnaud Massonnie : " L'action big data est une promesse de valeur d'usage, le digital est un outil fantastique pour l'analyse de données " à condition de " réconcilier les données digitales et les données off line ". Et de rappeler qu'il faut " être modéré dans l'ambition de ses projets ".

Commencer petit pour finir grand ? Nous laisserons le mot de la conclusion à Michel Bruley, pour qui le big data " c'est du talent, plus que des outils ". Une big ambition, donc.

L'expert Damien Cudel - Microsoft

Tout intégrer dans Microsoft Excel

Chez Microsoft, l'approche big data est assez pragmatique. Pour Damien Cudel, elle consiste à " savoir quelles sont les données dont vous avez besoin pour l'activité de votre entreprise. Les vôtres donc, mais aussi celles qui sont extérieures à votre entreprise. " Ce responsable marketing en charge des solutions tournant autour de la Business Intelligence avoue rencontrer avant tout des homologues marketing ainsi que les responsables d'opérations avant de discuter avec les directions informatiques.

Chez Microsoft, l'ambition affichée est de " tout intégrer dans Microsoft Excel ". Car l'enjeu n'est pas une affaire d'outils, il s'agit de " valider des hypothèses, comme de raconter des histoires ". Pour Damien Cudel, la business intelligence a déjà fait ses preuves. Les métiers veulent aujourd'hui de l'agilité, de l'autonomie ainsi que des outils collaboratifs. Les utilisateurs ont avant tout besoin de " trouver, d'analyser et de restituer " tout en faisant tomber les barrières technologiques. Et avec la solution proposée par Microsoft, Power BI, " on peut commencer petit et itérer vite ". C'est donc une solution qui a l'avantage d'utiliser ce que l'on connaît déjà.

Ce que propose Microsoft n'est pas la réponse big data à tout. Mais elle a le mérite d'essayer d'en finir avec la complexité apparente du sujet pour mettre en selle l'utilisateur. L'avantage de cette solution serait de rassurer " innover, c'est accepter de se tromper " et d'aborder le big data sous un jour plus humain.

Le big data, plus une affaire de méthode que d'outils.

5 Interview de Bruno Teboul enseignant à Paris-Dauphine, directeur scientifique, R & D et innovation de Keyrus

Bruno Teboul

Quel est, pour vous, l'enjeu du big data ?

Bruno Teboul : L' enjeu big data, c'est celui de la donnée non structurée, celle du NoSQL. C'est une rupture "programmatique". Le déluge informationnel n'est pas un mythe. Les données étaient déjà pléthoriques à la Renaissance. Ce phénomène n'est donc pas nouveau mais bien réel. On a déjà de gigantesques trésors de données. Seules 20 % de celles-ci sont en moyenne exploités. D'ailleurs, devons nous parler de données structurées ou non structurées ? Le terme "multistructurées" serait plus exact.

Un individu peut-il échapper à ses données ?

Pour maintenir une relation quasi parfaite entre le consommateur et la marque, il faut limiter le bruit. Sauf que le consommateur est cerné. L'intérêt pour un annonceur, consiste à diffuser l'information auprès de tous. C'est louable, souhaitable et inévitable. Quelqu'un de déconnecté est quelqu'un de suspect. Refuser d'être une identité numérique est illusoire. On peut se déconnecter mais on tombe alors dans une forme de suspicion. Il ne peut pas y avoir d'anonymat.

Qui peut travailler ces big data ?

Tout le défi est d'être créatif pour inventer de nouveaux algorithmes. Un data miner ne peut pas faire un bon data scientist. Les data sciences permettent de reconstruire la vie d'un humain dès lors que celui-ci laisse des traces sur le Web (ou "information shadows").

Comment voyez-vous évoluer le marketing face à cet enjeu ?

Le marketing doit intégrer l'aléatoire, la non-linéarité. Les signaux faibles sont plus importants que les signaux forts. Notre capacité à raisonner est limitée. Il est possible pour un humain d'opérer des choix autres qu'économiques.

On ignore la complexité du monde qui nous entoure. Le cerveau humain est victime de biais heuristiques et de raccourcis. Il faut donc apprendre à anticiper une réponse à une requête. On part des données brutes mais on cherche des corrélations. Il faut déterminer les causes les plus probables d'une observation surprenante. C'est tout l'enjeu du raisonnement dit "abductif". Grâce à ces nouvelles techniques, le marketing a l'opportunité de se renouveler. Il faut faire évoluer la discipline et ses techniques afin de répondre aux nouveaux consommateurs dans un nouveau monde.

Bruno Teboul est, avec Jean-Marie Boucher, l'auteur du livre Tout savoir sur l'absolu marketing, aux éditions Kawa.

Titulaire d'une maîtrise d'Épistémologie, d'un DEA de Sciences cognitives à l'école Polytechnique / EHESS et d'un Executive MBA HEC, il est actuellement doctorant en Sciences de gestion à l'université Paris-Dauphine, où il enseigne le marketing.

" Une discipline absente des manuels de marketing "

6 Interview de Bernard Ourghanlian directeur technique et sécurité Microsoft France

Bernard Ourghanlian

Comment voyez vous le big data ?

Bernard Ourghanlian : Dans cette perspective, on collecte tout. On cherche s'il existe des corrélations entre les choses. Peut-être qu'après on en trouvera la raison. Mais l'objectif c'est de faire le moins d'expériences possibles pour expliquer un phénomène. La préoccupation ne porte plus sur la qualité de la donnée. D'ailleurs nous devrions plus parler de "machine learning" que de big data.

Qu'est, pour vous, cette "machine learning" ?

On a fait des progrès en "machine learning" dans les années 1990-95, époque où l'on ne parlait pas encore de big data. Attention, le "machine learning" ne se résume pas à faire apprendre des données à la machine. Ici, on est dans une logique de détermination, avec une certaine probabilité qu'un phénomène soit lié à un autre. On se trouve dans une logique d'apprentissage. Il s'agit de prendre un ensemble de données et voir comment va réagir "la machine".

Quel est le constat ?

On a obtenu des résultats assez extraordinaires. On est capable de prévoir le futur. On l'a observé suite à l'analyse de 20 ans de Unes du New York Times. Avec une probabilité de 80 %, on a constaté que l'on pouvait déterminer les épidémies importantes et les grandes révolutions. On est donc capable de prévoir le comportement d'individus. C'est un sujet préoccupant. Que se passerait-il si de telles données étaient arrivées entre les mains d'un état totalitaire ? On touche ici du doigt le potentiel du big data mais également la problématique éthique.

Bernard Ourghanlian est docteur en mathématiques et est l'auteur de plusieurs ouvrages spécialisés relatifs aux statistiques et à l'informatique. Il a commencé sa carrière comme enseignant et chercheur à l'université d'Orsay.

" Faire le moins d'expériences possibles pour expliquer un phénomène "

Sur le même thème

Voir tous les articles Data
ConvictionS Média
sponsorisé
[Les convictions de ...] Georges Dos Santos, Directeur…

Livres Blancs

Voir tous les livres blancs

Vos prochains événements

Voir tous les événements

Voir tous les événements

S'abonner
au magazine
Se connecter
Retour haut de page