Data-lake : quels avantages pour le marketing ?
Publié par Floriane Salgues le - mis à jour à
Espace de stockage, le data-lake est à la base d'une stratégie big data. Mais, que peuvent en attendre les directions marketing ? Le cabinet de conseil Converteo dresse les principaux avantages de l'outil.
Un data-lake, c'est...
Qu'est-ce qu'un data-lake ? Si une douce rumeur met l'expression à la Une, le concept, et ses applications, ne sont pas encore (bien) connus. "Il s'agit d'un système de stockage de nouvelle génération permettant de stocker des volumes de données plus importants, qu'elles soient structurées ou non, et de les retraiter très rapidement", explique Thomas Faivre-Duboz, directeur associé de Converteo (ADLPerformance), cabinet de conseil spécialisé dans le digital et le cross-canal à l'origine du livre blanc Comprendre les data-lakes. Le data-lake s'appuie sur une infrastructure big data.
Les avantages de l'outil technologique ? Gagner en agilité et en efficacité, puisque le data-lake offre la possibilité "d'identifier le comportement des clients sur plusieurs canaux, points de vente physique ou canaux digitaux, et d'exploiter ces données de manière croisée". Autre atout, et non des moindres, diminuer les coûts, notamment de stockage. "Les données peuvent être hébergées dans le Cloud, via Google, Microsoft ou Amazon, par exemple, réduisant très significativement les coûts de stockage par rapport à l'hébergement sur des serveurs internes, pouvant rapidement représenter des sommes de plusieurs centaines de milliers à plusieurs millions d'euros", poursuit-il.
Valoriser le potentiel data
Selon Converteo, le data-lake donne aux organisations les moyens d'exploiter et de valoriser leur potentiel data :
Quelles différences avec le datawarehouse... et la DMP ?
"Le datawarehouse stocke les données structurées permettant de réaliser des analyses déjà programmées, indique Thomas Faivre-Duboz. Quand le data-lake représente un stockage à première vue plus anarchique, mais qui offre un croisement rapide des données plus ou moins structurées au moment de l'analyse." Les data-lakes ne remplacent pas totalement les datawarehouses, prévient le directeur associé de Converteo : "les deux modèles peuvent cohabiter."
Quelles différences avec la Data Management Platform ? Le data-lake est un outil qui va centraliser toutes les données brutes de l'entreprise dans un objectif de business intelligence, d'analyse métier et de mise à disposition de données pour des usages très variés. La DMP, quant à elle, va être plus orientée vers l'activation de canaux marketing (média, e-mail, sms), explique Converteo : Contrairement au data-lake, "la DMP n'a pas vocation à stocker tout type de données, notamment les données personnelles des visiteurs, prospects et clients (PII), ainsi que les données sensibles de l'entreprise (marge, achats, etc.) - du moins de manière non cryptée." Là encore, la complémentarité est de mise.
Quels usages ?
Pour les directions marketing, le data-lake promet de rendre plus facile l'utilisation de la donnée dans les prises de décision marketing. "C'est un réel avantage pour mettre en oeuvre un marketing plus rapide, en mode test and learn, relève Thomas Faivre-Duboz, qui poursuit : "Un autre avantage est le désilotage. Les directions marketing ont eu tendance à faire des analyses mono-canal. Le data-lake lève les difficultés de réconciliation des canaux et des types de données très variées."
Les usages sont nombreux. Ainsi, l'enseigne Picard a sauté le pas du data-lake pour identifier les appétences canal - magasins versus Web - afin d'optimiser ses campagnes de couponing. La filiale du Crédit Agricole, Sofinco a oeuvré à la personnalisation des campagnes RTB pour optimiser les investissements médias.
Mais, attention, prévient le directeur associé de Converteo, "la mise en oeuvre d'un data-lake doit surtout procéder d'une réflexion sur les usages innovants que l'on a envie de faire de la data (cas d'usages), avant de plonger tête baissée dans la technique."
Quel coût ?
Le coût de la mise en oeuvre d'un data-lake dépend du volume de données à stocker, auquel s'ajoute le coût de setup du flux de données. "Il ne faut pas oublier le coût d'une réflexion autour de l'inventaire de données disponibles et l'ordre d'intégration des données à l'outil."