Comment expliquer le Big Data à sa maman ?
Chère maman - La dernière fois, au téléphone, tu m’as dit que tu avais lu sans bien les comprendre les articles du Figaro, des Echos et du New York Times sur cette chose qu’on appelle « Big Data ». Comme promis, je vais essayer de t’expliquer de quoi il s’agit.
En repartant de la définition de « data » que je t’avais donnée – « quelque chose dont tu veux te souvenir et que tu gardes quelque part pour l’utiliser plus tard » – il est assez logique tu aies pensé que le Big Data était tout simplement « quelque chose de GRAND dont tu veux te souvenir… ». En fait, avec le Big Data, comme avec la plupart des notions et concepts marketing qui ont cours dans l’industrie, nous nous sommes arrangés pour embrouiller tout le monde – y compris nous-mêmes…
Alors, je vais te proposer une définition de Big Data que tu pourras sans difficulté partager avec tes amies. Le Big Data regroupe des pratiques et des technologies émergentes utilisées pour gérer principalement trois choses : (1) des quantités de données tellement énormes qu’elles dépassent l’entendement et tout ce que l’on a connu dans le passé ; (2) de nouveaux types de données complexes dont la plupart des entreprises n’ont aucune expérience, et (3) les changements de plus en plus rapides qui affectent toutes ces données.
Pour que tu comprennes comment on est passé des données ordinaires aux données Big Data, je vais décortiquer chacun de ces points.
- De grands volumes de données. “Grand” est un terme relatif. Tu as 200 noms et adresses dans ton carnet d’adresses et quand papa et toi faites vos cartes de vœux chaque année, cela vous prend pas mal de temps d’imprimer toutes ces adresses et de coller les étiquettes et les timbres sur le enveloppes. 200, cela te paraît beaucoup. Mais c’est un jeu d’enfant pour une enseigne qui envoie son catalogue de fin d’année à 20 millions de clients. Et 20 millions d’envois, c’est vraiment pas grand-chose par rapport au milliard d’utilisateurs que gère Facebook. Et ça ne s’arrête pas là : fin 2012, Twitter estimait que ses utilisateurs envoyaient 400 millions de tweets par jour – cela fait 146 milliards de tweets par an et ça ne cesse d’augmenter.
- De nouveaux types de données. De « petites » données traditionnelles sont générées par toutes les tâches que font toutes les entreprises : prendre une commande, répondre à une demande de service client, passer une commande à un fournisseur… Pense à ce que tu fais quand tu passes une commande sur Amazon.com : tu remplis tout un tas de champs séparés avec ton nom, ton prénom, l’adresse de livraison, de facturation, ton numéro de carte de crédit, etc. En capturant une par une les données de tous ces champs, Amazon.com sait exactement ce que chaque ce que chacune d’elle représente. C’est ce qu’on appelle des données « structurées ». Mais la plupart des informations qui circulent dans le monde ne sont pas si structurées. Des données non structurées, tu en crées tout les jours : tes emails, tes posts Facebook et tes tweets et même tes conversations téléphoniques en sont des exemples. Sans parler des données de consommation que tes compteurs de gaz et d’électricité vont bientôt envoyer à tes fournisseurs pour qu’ils puissent te facturer.
- Des données toujours plus nombreuses et plus fréquentes. Les données apparaissent et bougent de plus en plus vite. Une enseigne de grande distribution peut assez facilement vendre sept millions d’articles par jour. Comme je te le disais, Twitter génère 400 millions de tweets par jour. En 2012, Google enregistrait 5 milliards de recherches par jour : plus de 1,8 trillons de recherche par an. C’est ça les Big Data !
Tu me diras OK, mais cela n’explique pas pourquoi tout le monde s’excite sur cette affaire de Big Data.
Pense à ton dernier post sur Facebook. Tu t’es lancée dans une diatribe sans précédent pour dire à tes amis que tu étais dans une rage folle parce que la super machine à café expresso que tu avais commandé en ligne était arrivée cassée et que tu avais été très mal reçue quand tu avais appelé le transporteur et le distributeur pour te plaindre. Eh bien, pour le transporteur, le détaillant et tous leurs concurrents, les informations que contenait ton post sont un véritable trésor que tous aimeraient pouvoir récupérer. Les technologies de Big Data permettent de récupérer ton billet ainsi que des centaines de millions d’autres sur Facebook, Twitter, LinkedIn, sur des blogs, et tout autant d’emails adressés à des services clients pour fournir à ces entreprises de précieuses informations qui les aideront à ne pas perdre leurs clients.
Mais si on parle autant des Big Data ce n’est pas seulement parce qu’elles permettent d’améliorer la satisfaction client : beaucoup de gens pensent que les Big Data sont la clé qui vont permettre à l’humanité de résoudre les gigantesques défis médicaux, environnementaux et sociaux qui sont devant nous. Comme tu débrouilles bien en anglais, il y a un très bon bouquin que tu devrais prendre le temps de lire entre deux de tes magazines favoris : “The Human Face of Big Data” de Rick Smolan. Ce qu’il écrit est fantastique et très facile à comprendre.
Je t’embrasse fort,
PS : si quelqu’un te raconte que les Big Data c’est un super-compliqué et qu’il commence à te parler choses bizarres comme Hadoop, MapReduce, ou “les 3 V”, ne l’écoute pas. Dis-lui « je comprends » en hochant la tête et laisse-le gentiment en plan…