La data au service de l'innovation
Le «data déluge». C'est ainsi que les analystes définissent la nouvelle vague de données qui déferle sur les systèmes d'information. L'expression est à peine exagérée... Si l'on en croit IDC, le volume de données sauvegardées et répliquées dans le monde a atteint 1,8 zettaoctets (1,8 milliard de téraoctets) en 2011. Et le cabinet américain table sur un minimum de 35,2 zettaoctets à stocker d'ici à 2020, dont une écrasante majorité de données non structurées créées par les utilisateurs eux-mêmes! Pour les entreprises, l'entreposage des données est devenu un objectif stratégique. Car, outre le volume d'informations à traiter, la difficulté réside dans la prise en compte de leur vitesse de circulation et de leur variété: les fameux trois V (velocity variety et volume, en anglais) qui servent aujourd'hui à définir le phénomène de «big data».
Ariane Phélizot, directrice marketing et développement de Buzzcar.
ZOOM
Partager sa voiture... et ses infos
Buzzcar, service français de partage de voitures entre particuliers, a été créé en 2011 par Robin Chase, la fondatrice de Zipcar, aux Etats-Unis, et l'équipementier automobile Mobivia (anciennement Norauto). Ce site a vu le jour grâce à une plateforme en ligne d'échange d'informations. « L e s outils - web et mobile - facilitent la mise en relation entre les propriétaires de véhicules et les conducteurs à la recherche d'une location à l'heure ou à la journée », détaille Ariane Phélizot, directrice marketing et développement du service. Concrètement, le loueur reçoit une notification de chaque demande, qu'il accepte ou refuse. S'il accepte, il convient d'un horaire et d'un lieu pour remettre ou faire remettre les clés au conducteur intéressé. Avant de prendre le volant, le locataire du véhicule utilise son mobile pour dresser un petit état des lieux. « S'il aperçoit une rayure ou une bosse qu'il juge anormale, il lui suffit de prendre une photo (géolocalisée et horodatée par Buzzcar) avec l'application puis de la publier avec un commentaire sur la page du propriétaire », précise Ariane Phélizot. De son côté, Buzzcar suit la communauté grandissante de «buzzers» afin de personnaliser ses services sur smartphone et de signaler en temps réel, à chaque inscrit, la liste des véhicules en location à proximité de son domicile.
QUAND L'ENTREPRISE EST PILOTEE PAR LA DONNEE
Les entreprises apprivoisent peu à peu l'univers du big data. « De nombreux sites web ont vu leur audience et le volume de transactions s 'envoler durant ces deux dernières années », relève Mathieu Llorens. Pour le directeur général de l'éditeur de solutions de «web analytics» AT Internet, « ces sites ont compris qu'ils avaient intérêt à apprendre à mieux suivre les données de connexion et de navigation, notamment pour vérifier l'ergonomie de leurs interfaces et pour analyser la performance des différentes campagnes». Et la mesure d'audience sur Internet n'est qu'un volet de leur exploitation. Rachel Delacour, cofondatrice de l'éditeur montpelliérain de services en ligne d'analyse décisionnelle Bime, souligne que les entreprises doivent aussi gérer «la montagne d'informations générées quotidiennement par les systèmes internes de gestion de la relation client, les progiciels financiers, les dispositifs qui servent à gérer la logistique... ».
Pour faire fructifier ces informations, la collecte ne suffit pas. Il faut aussi identifier, dans cette masse d'informations, les données pertinentes, puis les croiser et les analyser. Ce travail est aujourd'hui rendu possible par la démocratisation de grandes plateformes open source, comme la solution d'analyse de données Hadoop (initialement créée par Yahoo!), le système d'entrepôt de données Hive (essaimé des laboratoires de Facebook) ou les logiciels de traitement et d'analyse BigQuery et MapReduce (lancés par Google)... S'ils sont les plus connus, ces logiciels libres ne sont pas seuls au monde. Sur le marché international se multiplient les versions commerciales d'Hadoop (Cloudera, MapR...) et les solutions d'analyse de données de spécialistes comme IBM (avec InfoSphere BigInsights) ou BearingPoint (avec la solution HyperCube, rachetée en 2012). Fondé sur un algorithme mathématique, HyperCube permet, par exemple, «d'identifier des profils spécifiques de clients et certains types de comportements dans une grande masse de données», explique Augustin Huret, fondateur et président d'HyperCube Research.
Une chaîne de restauration a récemment utilisé ce logiciel pour analyser les facteurs clés de performance de ses points de vente et se réorganiser en conséquence. Il est apparu que les résultats des établissements étaient fonction de critères de performance classiques (type de surface, ancienneté du management et du personnel...), mais aussi d'autres paramètres plus originaux, comme «la visibilité de la file d'attente à partir de l'extérieur du magasin », rapporte Augustin Huret.
Frédéric Krebs, directeur général France d?Allociné.
ZOOM
Allociné fait son cinéma
Bien connu des passionnés du 7e art (11 millions de Français fréquentent chaque mois, la plateforme), Allociné gère une base de données regroupant plus d'un million de fiches de films, près de 450 000 fiches personnalités (acteurs, réalisateurs, techniciens...) et environ 30 000 vidéos.
Autre grande spécificité du site: ses 2,6 millions d'utilisateurs enregistrés ont à ce jour «attribué plus de 50 millions de notes à des films ou à des séries télévisées qu'ils ont vus», relève Frédéric Krebs. Pour le directeur général France d'Allociné, il s'agit d'une mine d'or: «Nous pouvons nous appuyer sur ces informations pour déterminer les goûts et habitudes cinématographiques de chacun et faire des recommandations personnalisées» Le site compte bien aller plus loin. «D'ici à la fin de l'année, nous allons mettre en service un nouveau moteur de découverte de films, couplé à un système d'alertes, annonce Frédéric Krebs.
Si un membre est fan de thrillers ou de polars des années soixante-dix, par exemple, nous lui adresserons la liste des films qu'il faut avoir vus dans ces catégories.» Allociné mise aussi sur le mobile, et compte s'appuyer davantage sur les données liées aux affinités et à la localisation géographique de chaque membre de la communauté. L'idée? Proposer en temps réel aux cinéphiles - «en mode push» - des informations et des remises pour les films diffusés à proximité des lieux où ils se trouvent.
LES NOUVEAUX SERVICES QUI S?APPUIENT SUR LE TRAITEMENT DE L'INFORMATION
Les start-up sont également nombreuses à s'appuyer sur le traitement de données pour proposer de nouveaux services. Le cas de Plyce, service français de bons plans géolocalisés sur mobile, est emblématique. «A ce jour, il actualise quotidiennement près de 7 milliards de données, comme la localisation des points de vente partenaires, leurs catalogues et les flux de stocks des enseignes... », expose sa cofondatrice, Sandrine Dirani. L'intérêt? « Une fois géolocalisé, chaque utilisateur de l'application mobile se voit indiquer où il peut aller, où il peut trouver le produit qu'il recherche et à quel prix», poursuitelle. Dans la même veine, la nouvelle application mobile de gestion des finances personnelles Bankin', conçue par la jeune pousse Perspecteev, scrute les comptes des utilisateurs pour déterminer leurs principaux postes de dépense. Elle est déjà compatible avec les services web de dix banques françaises. Lorsqu'une de leurs transactions n'est pas automatiquement identifiée, les utilisateurs sont sollicités pour la ranger dans la bonne catégorie. «Bankin' apprend en permanence de sa communauté», souligne Joan Burkovic, cofondateur de l'entreprise. Cela signifie aussi que Perspecteev glane des données susceptibles d'être un jour valorisées. «Lorsque nous aurons atteint la taille critique, nous espérons effectuer des traitements statistiques à partir des transactions, par exemple en déterminant la part de marché de tel ou tel fournisseur d'accès internet dans notre base d'abonnés ou bien certaines tendances de consommation sur un lieu donné, indique le jeune créateur. Les informations resteront toujours anonymes et stockées de manière sécurisée sur un serveur nous appartenant », rassure-t-il.
A l'avenir, les «open data» - données issues de la libération des données publiques -, viendront compléter les données commerciales, marketing et financières des sociétés. « Ces données constituent déjà un levier d'intelligence supplémentaire pour les entreprises qui les réutilisent », déclare Martin Duval, p-dg de Bluenove, cabinet de conseil en open innovation. Les open data sont aussi un gage d'innovation pour les entreprises qui les mettent à la disposition du public. Elles s'inspirent ainsi des trouvailles des développeurs qui les exploitent dans leurs applications. La start-up hexagonale Home'n'go, par exemple, s'est récemment distinguée avec un service en ligne qui permet à un candidat à la location de dénicher, mémoriser et centraliser toutes sortes d'informations utiles dans le cadre d'une recherche de logement. « On trouve, parmi ces données des annonces immobilières (Pap.fr, Seloger.com, Avendrealouer.fr...), mais aussi des données provenant de différentes sources publiques - taux de criminalité, bureaux de poste équipés d'un distributeur de billets... », précise Margaux Pelen, cofondatrice du service.
DES STRATEGIES A INVENTER
Reste que toutes les données ne sont pas utilisables. « On a coutume de dire que 90 % des données recueillies dans le cadre d'une étude de marché classique sont exploitables, rappelle Thierry Vallaud, responsable du data mining et de la modélisation chez Socio Logiciels. Dans le cas du big data, 10 % des données peuvent effectivement être décodées, et donc utilisées ». En outre, les coûts des serveurs affectés au stockage, qui permettent de traiter ces données, ne sont pas à la portée de toutes les budgets. D'après Thierry Vallaud, « il faut compter environ 160 000 euros pour un petit serveur de big data Netezza d'IBM, basé sur une architecture massivement parallèle ».
In fine, le plus important sera sans doute d'identifier les données qui ont le plus de valeur pour les extraire et les analyser en priorité. « Il n'y a pas de bonne donnée sans bonne stratégie. Ce qui compte ce n'est pas d'acheter des serveurs ultra-performants ou des logiciels miracles, mais d'aller chercher l'information la plus intelligente possible sur chaque client (son profil, son parcours, ses habitudes de consommation...), conclut Guillaume Chollet, p-dg de l'agence de marketing relationnel B to B Loyalty Expert. La bonne information n'est pas forcément la plus compliquée, mais celle qui peut être mise en application pour stimuler les ventes.»
Eric Caprioli, avocat à la cour de Paris.
ZOOM
Protection des données personnelles: un projet de règlement européen
Le 25 janvier 2012, la Commission européenne a proposé un nouveau projet de règlement européen sur la protection des données personnelles, censé réformer la directive 95/46/CE, transposée à des degrés divers dans les droits nationaux des 27 Etats membres de l'Union. « S'il est adopté, le nouveau règlement s'appliquera immédiatement dans tous les Etats - sans nécessité de le transposer dans les droits nationaux - et il devrait modifier de façon substantielle la législation concernant le traitement des données à caractère personnel, commente Eric Caprioli, avocat à la cour de Paris. Notamment parce qu'il doit consacrer le droit à l'oubli et renforcer l'obligation d'information et le consentement des personnes tout en maintenant le droit d'accès, de suppression ou de rectification des données les concernant. » Toujours selon Eric Caprioli: « le futur règlement européen devrait aussi rendre obligatoire la notification par les entreprises des éventuelles failles concernant les traitements des données des individus aux instances nationales chargées de la protection des données personnelles, ainsi que la nomination d'un correspondant à la protection des données dans toutes les sociétés de plus de 250 salariés. »