Pour gérer vos consentements :

Lumière sur… les 6V du Big Data

Publié par le - mis à jour à

Avoir une Data permet aux entreprises reposant sur une vue classique du marché (basée sur l’intuition) de migrer vers une analyse s’appuyant sur des métriques. En d’autres termes, il leur donne la possibilité d’exploiter leurs données pour une prise de décision plus avisée...

Mais que faire si elles doivent faire face à une explosion de volumes de données issues des ERP, CRM, web, réseaux sociaux, etc.. ?
Cette surcharge d’informations qui prend des formes variées (mails, photos, vidéos, commentaires sur les réseaux sociaux, signaux GPS, transactions bancaires,…) constitue le paradigme de Big Data que l’on expose ci-après en six dimensions.

• V comme Volume
Il s’agit de la surcharge d’informations évoquées plus haut et qui devient exponentielle grâce à l’arrivée massive des objets connectés. Comptabilisés en téraoctets, ces nuages de données provoquent de forts besoins analytiques et d’exploitation.
• La Variété
La data peut prendre des formes variées et hétérogènes. La prolifération de types de données (textes, documents bureautiques, images, données de capteurs, son, vidéos, données de géolocalisation, échanges sur les forums / réseaux sociaux, Etc.) implique une grande diversité.
• La Véracité
La véracité fait référence à la fiabilité et à la dimension qualitative des données. Établir la confiance en l’information représente un challenge de taille des Big Data qui se traduit par l’importance de traiter et de gérer l’incertitude inhérente liée à certains types de données.
• La Valeur
Un projet Big Data n’a de sens que s’il permet de créer de la valeur, qui est aussi le résultat d’une confrontation entre les données structurées internes et les données non structurées externes.
• La Vélocité
La vélocité, autrement dit la vitesse, caractérise la fréquence à laquelle la data est générée, capturée, partagée et mise à jour. En effet, tirer profit du Big data implique de traiter des données dynamiques et à vitesse grand V.
• La Visualisation
Comme une cerise sur le gâteau, ce dernier V permet de créer des codages de données en canaux visuels visibles et compréhensibles, simplifiant ainsi leur interprétation. Ce processus permet, en effet, d’externaliser les données pour offrir des visualisations interactives, intuitives et personnalisées via des outils analytiques et des tableaux de bord capables d’améliorer la prise de décision.

Nous y voilà plus éclairés sur les problématiques qui accompagnent la Big Data, mais quelles conclusions d’ordre pratique pouvons-nous en tirer ? Quelles questions doit-on se poser avant de se lancer dans un projet Big Data ?

L’interprétation d’un large volume de données est le principal défi du Big data. Dans les faits, c’est le même raisonnement logique qu’on adopte pour résoudre une problématique complexe c'est-à-dore décortiquer et dénouer petit à petit. Vous conviendrez que l’ordre choisi pour nos Six V n’est pas totalement anodin. Il s’agit en effet d’un classement par priorité et par étape de traitement.

Quand Volume et Variété vous font face, alors ClasserRépertorier et Trier sont les mots d’ordre. Cela revient à répondre aux deux questions essentielles :

Il s’agira de répertorier soigneusement les sources de vos données et de réfléchir à la structure future que pourrait avoir votre base. Il s’agit concrètement de réfléchir à l’intitulé et au contenu des tables qui constitueront votre future base de données. Celles qui me viennent à l’esprit pour un usage polyvalent sont : Contacts, Sociétés, Factures, Produits, Historique Actions marketing, etc. Votre schéma initial pourra très bien ne pas ressembler à celui que vous allez adopter au final mais c’est le début indispensable qui vous permettra de passer à l’étape suivante.

Vous allez, dès lors, commencer à trier vos informations et c’est là que Dame Véracité et DameValeur entrent en jeu pour exiger des réponses à la question :

Votre outil de facturation regorge d’informations sur vos clients. Si Secteur d’activité, Adresse Mail, Code Postal et Numéro de tel sont indispensables à la réalisation de vos actions marketing, RIB et Numéro de TVA intra-communautaire ne seront, en revanche, utiles que pour des usages très spécifiques que vous n’aurez probablement pas à utiliser. Inutile donc d’encombrer votre base de données avec. Ne gardez que les informations utiles dans vos projets. Bien entendu, vous serez seul à juger la pertinence et la véracité de vos informations.

II – Définir liens, flux et règles de mise a jour

Avant que ce cinquième V ne vous prenne de vitesse, pensez à répondre à ces questions :

Associer chaque champ figurant dans une table à une source et choisir par quel moyen le flux de données sera-t-il acheminé. Les possibilités sont multiples allant d’une simple insertion manuelle à un import automatique via API. Les avancées technologiques dans ce domaine vous donneront pleine satisfaction. N’hésitez pas à demander la lune. Elle vous sera servie.

Décider si la nouvelle information doit écraser l’ancienne ou la garder dans l’historique tout en signalant le changement. Le procédé peut s’avérer particulièrement utile pour détecter des opportunités de vente. Prenons l’exemple d’un changement d’adresse client pour une entreprise qui vend des articles de déco. Il y a surement une opportunité à exploiter.

Il s’agit de décider de la fréquence à laquelle vos données seront mises à jour. Cette dernière doit prendre en compte la cadence d’arrivée de vos informations et la nature des flux entre vos sources et votre base. Plus vos flux sont automatisés, moins vous aurez de contraintes. Plus vos flux sont manuels, plus votre capacité de gestion est déterminante.

III – Se faire accompagner

Si vous avez les réponses à toutes ces questions, vous êtes enfin prêts pour vous lancer dans un projet Big Data. Ce sont les informations que vous serez tenu de fournir à votre consultant BI pour commencer la mise en place physique de votre DMP. La création de votre base et le paramétrage des liens et des flux de données nécessite le recours à des outils avancés et des opérations complexes qui vous seront totalement transparentes grâce à l’intervention de spécialistes. L’exploitation de votre DMP n’en sera que facilitée. Vous pourrez dès lors vous attaquer à la Visualisation de votre DATA. Ce vaste domaine qui couvre à la fois les techniques de ciblage, le scoring et les tableaux de bord décisionnels sera exposé en détail dans nos prochaines communications.

La rédaction vous recommande

  • Le congrès Big Data Paris revient les 9 & 10 mars prochains à Paris pour une neuvième édition qui s'annonce plus " Big " que jamais.
  • La smart data au service de la prospection digitale de toutes les entreprises
  • Éric Joulié, président de Teradata France et vice-président pour L'Europe du Sud, le moyen Orient et l'Afrique
  • Un formidable gisement à exploiter
  • Big data, big challenge