Recherche

Les entrepôts de données à l'heure du Web

Spécialiste des entrepôts de données et auteur de plusieurs ouvrages sur le sujet, Ralph Kimball vient de publier un livre intitulé "Le data webhouse"*, en collaboration avec Richard Merz, directeur technique de la division WebCom de l'hébergeur Verio.

Publié par le
Lecture
4 min
  • Imprimer


Objectif des auteurs : déterminer le rôle et l'impact d'un "Web-entrepôt de données". Leur méthode : enregistrer le "flux des clics", une nouvelle et riche source de données comportementales. Les auteurs prodiguent nombre de conseils pratiques sur la façon d'enregistrer et de stocker tous les faits et gestes des visiteurs d'un site, d'exploiter cette base de données comportementales pour améliorer l'ergonomie du site, pour mieux cibler ses actions marketing, pour proposer au client des offres personnalisées. Malgré une traduction française parfois éloignée de la perfection, l'ouvrage s'avérera utile aux décideurs, aux responsables opérationnels marketing et commerciaux, aux architectes des entrepôts de données, aux spécialistes de la mesure d'audience et de la publicité sur le Web. Trois questions à Ralph Kimball.

Dans votre livre, vous parlez des Web-entrepôts de données. Y a-t-il une différence de fond avec l'entrepôt de données tout court ou bien s'agit-il juste d'une version adaptée à Internet ?


Ralph Kimball : Le Web-entrepôt de données est une évolution de l'entrepôt de données classique, apparue pour répondre aux nouvelles contraintes d'Internet. Les deux grandes différences sont d'abord l'introduction du flux des clics. Cette nouvelle source de données est beaucoup plus importante et contient sensiblement plus de données comportementales que n'importe quelle autre source de données connue. Le flux des clics nécessite des techniques d'extraction et d'analyse nouvelles, pas encore développées. Ensuite, le Web a imposé plusieurs changements dans l'architecture de l'entrepôt : le déploiement distribué, l'approche prévisionnelle des performances, l'accès à tous les résultats avec un navigateur Internet, une nouvelle interface d'utilisateur, et aussi l'internationalisation. Avec le Web, les entrepôts de données ont migré dans la sphère opérationnelle de l'entreprise car les utilisateurs s'attendent à suivre l'état de leur business en temps réel et à tous les niveaux de l'entreprise, à travers le Web-entrepôt. En fin de compte, le Web a même changé la politique des prix chez les commerçants. Le Web-entrepôt est donc en plusieurs points différent de l'entrepôt de données classique.

Enregistrer le flux de clics va procurer une base de données gigantesque. Peut-on la gérer et la manipuler autrement qu'avec le plus grand ordinateur au monde ?


R. K : Dans mon livre, je donne quelques exemples des différents tableaux d'extraction basés sur le flux de clics. Ils offrent aussi des bases avec du contenu et des tailles différentes. En fait, ce n'est pas une très bonne idée d'enregistrer et de sauvegarder tous les événements à partir d'une page web. Vous pouvez comprendre beaucoup de choses sur le comportement de vos consommateurs en étudiant uniquement des échantillons statistiques.

Quel est le coût d'un Web-entrepôt de données ? Quel retour sur investissement peut-on espérer ?


R. K : Les dépenses liées à la gestion d'un entrepôt de données, qu'il soit ou non attaché au Web, sont proportionnelles au volume des données à extraire des sources et aussi à leur qualité, à leur "propreté". Il n'y a pas vraiment de coût unitaire. Les Web-entrepôts de données dans l'entreprise peuvent aussi bien jouer le rôle stratégique que d'occuper un poste d'importance moindre et avec des investissements inférieurs. Autrement dit, il est aussi rentable de créer son Web-entrepôt de données sur un simple PC que sur un Sun Sparc Server 10000. Quant aux bénéfices de n'importe quel Web-entrepôt, ou d'un entrepôt de données tout court, ils proviennent des décisions que vous allez prendre grâce à l'utilisation de leurs données. Dites-moi quelles sont les décisions prises avec l'aide de votre Web-entrepôt de données et je vous dirai quel est votre retour sur investissement. * Le data webhouse - analyser les comportements client sur le Web, de Ralph Kimball et Richard Merz. Ed. Eyrolles, 330 pages, 280 francs. Adresses utiles : www.editions-eyrolles.com www.wiley.co.uk/compbooks/kimball/ www.webhouse-toolkit.com/

Alexis Nekrassov

S'abonner
au magazine
Se connecter
Retour haut de page