Les entrepôts de données à l'heure du Web
Spécialiste des entrepôts de données et auteur de plusieurs ouvrages sur le sujet, Ralph Kimball vient de publier un livre intitulé "Le data webhouse"*, en collaboration avec Richard Merz, directeur technique de la division WebCom de l'hébergeur Verio.
Objectif des auteurs : déterminer le rôle et l'impact d'un "Web-entrepôt de
données". Leur méthode : enregistrer le "flux des clics", une nouvelle et riche
source de données comportementales. Les auteurs prodiguent nombre de conseils
pratiques sur la façon d'enregistrer et de stocker tous les faits et gestes des
visiteurs d'un site, d'exploiter cette base de données comportementales pour
améliorer l'ergonomie du site, pour mieux cibler ses actions marketing, pour
proposer au client des offres personnalisées. Malgré une traduction française
parfois éloignée de la perfection, l'ouvrage s'avérera utile aux décideurs, aux
responsables opérationnels marketing et commerciaux, aux architectes des
entrepôts de données, aux spécialistes de la mesure d'audience et de la
publicité sur le Web. Trois questions à Ralph Kimball.
Dans votre livre, vous parlez des Web-entrepôts de données. Y a-t-il une différence de fond avec l'entrepôt de données tout court ou bien s'agit-il juste d'une version adaptée à Internet ?
Ralph Kimball : Le Web-entrepôt de
données est une évolution de l'entrepôt de données classique, apparue pour
répondre aux nouvelles contraintes d'Internet. Les deux grandes différences
sont d'abord l'introduction du flux des clics. Cette nouvelle source de données
est beaucoup plus importante et contient sensiblement plus de données
comportementales que n'importe quelle autre source de données connue. Le flux
des clics nécessite des techniques d'extraction et d'analyse nouvelles, pas
encore développées. Ensuite, le Web a imposé plusieurs changements dans
l'architecture de l'entrepôt : le déploiement distribué, l'approche
prévisionnelle des performances, l'accès à tous les résultats avec un
navigateur Internet, une nouvelle interface d'utilisateur, et aussi
l'internationalisation. Avec le Web, les entrepôts de données ont migré dans la
sphère opérationnelle de l'entreprise car les utilisateurs s'attendent à suivre
l'état de leur business en temps réel et à tous les niveaux de l'entreprise, à
travers le Web-entrepôt. En fin de compte, le Web a même changé la politique
des prix chez les commerçants. Le Web-entrepôt est donc en plusieurs points
différent de l'entrepôt de données classique.
Enregistrer le flux de clics va procurer une base de données gigantesque. Peut-on la gérer et la manipuler autrement qu'avec le plus grand ordinateur au monde ?
R.
K : Dans mon livre, je donne quelques exemples des différents tableaux
d'extraction basés sur le flux de clics. Ils offrent aussi des bases avec du
contenu et des tailles différentes. En fait, ce n'est pas une très bonne idée
d'enregistrer et de sauvegarder tous les événements à partir d'une page web.
Vous pouvez comprendre beaucoup de choses sur le comportement de vos
consommateurs en étudiant uniquement des échantillons statistiques.
Quel est le coût d'un Web-entrepôt de données ? Quel retour sur investissement peut-on espérer ?
R. K : Les dépenses liées à la
gestion d'un entrepôt de données, qu'il soit ou non attaché au Web, sont
proportionnelles au volume des données à extraire des sources et aussi à leur
qualité, à leur "propreté". Il n'y a pas vraiment de coût unitaire. Les
Web-entrepôts de données dans l'entreprise peuvent aussi bien jouer le rôle
stratégique que d'occuper un poste d'importance moindre et avec des
investissements inférieurs. Autrement dit, il est aussi rentable de créer son
Web-entrepôt de données sur un simple PC que sur un Sun Sparc Server 10000.
Quant aux bénéfices de n'importe quel Web-entrepôt, ou d'un entrepôt de données
tout court, ils proviennent des décisions que vous allez prendre grâce à
l'utilisation de leurs données. Dites-moi quelles sont les décisions prises
avec l'aide de votre Web-entrepôt de données et je vous dirai quel est votre
retour sur investissement. * Le data webhouse - analyser les comportements
client sur le Web, de Ralph Kimball et Richard Merz. Ed. Eyrolles, 330 pages,
280 francs. Adresses utiles : www.editions-eyrolles.com
www.wiley.co.uk/compbooks/kimball/ www.webhouse-toolkit.com/