Very big data via Twitter
Publié par Hugues Serraf le | Mis à jour le
Le big data, c'est so last year... Voici le very big data généré par les réseaux sociaux et les crânes d'oeufs des universités américaines et, franchement, il ne fait pas de prisonniers.
La décision par Twitter de " monitorer " le contenu des messages émis sur sa plateforme ne lui permettra pas seulement d'afficher des pubs contextuelles adaptées (Google fait ça depuis des lustres dans Gmail et c'est désormais à la portée du premier cookie venu), mais bien de définir le " profil psychologique " de ses utilisateurs.
Balancer un tweet sponsorisé pour un marchand de vélos à une automobiliste qui vient juste d'écraser un cycliste et s'en vante naïvement en 140 caractères, c'est en effet le ras des pâquerettes de l'analyse sémantique -- un peu comme si je recevais une offre flash Interflora parce que je viens d'écrire ça. Non, le projet est bien plus sophistiqué, comme en témoignent les travaux du professeur Tal Yarkoni de l'université du Colorado sur le " personnality profiling ".
Ainsi, lorsque vous bavardez tranquillement sur les réseaux sociaux, la nature et la fréquence des mots que vous utilisez, quels qu'ils soient, permettent de construire un portrait en creux de votre psyché. 50 tweets suffisent au chercheur pour vous percer totalement à jour et vous connaître aussi bien que si vous lui aviez rempli un questionnaire d'autant de pages pour votre inscription à Adopte Un Mec (avec 200 tweets, il peut même vous apprendre des trucs sur vous dont vous n'avez pas idée et que vous ne voulez sans doute même pas savoir).
Bien sûr, un twittos qui passe son temps à utiliser les mots " bar ", " mojito ", " pécho ", " 06 " ou " 260 km/h " sera sans surprise un extraverti auquel on peut tenter de vendre des vacances au Club Med et un cabriolet italien ; tout comme un Facebook friend plus porté sur " Heidegger ", " Apichatpong Weerasethakul " et " sandales Birkenstock se verra proposer un abonnement à Télérama... Mais le professeur Tarkoni va plus loin, en décryptant des corrélations entre des mots moins connotés et en déterminant avec précision ce que sont vraiment vos attentes dans la vie avant même que vous les ayez formulées. Un autre chercheur Yankee, le Californien Eben Haber, a même accumulé trois mois de tweets portant sur 90 millions d'utilisateurs distincts pour parvenir à des résultats de la même eau, remplaçant les bonnes vieilles données socio-démographiques de nos grands-mères par une sorte de code génétique du consommateur.
Est-ce que c'est bien ou est-ce que ça fait peur -- le marketeur susceptible de payer pour ces données étant lui-même sur Twitter et Facebook à ses heures perdues et pouvant s'offusquer de ce que l'on en apprenne autant sur ses tréfonds -- c'est trop tôt pour le dire... Après tout, une société où l'on se géolocalise volontairement en arrivant au McDo de la place de la République n'est plus tout à fait une société qui valorise l'intimité et le secret. La seule chose que l'on sache en fait, c'est que ça sera diaboliquement efficace.
Mais tiens, je me demande ce que je vais recevoir comme pub lorsque je twitterai ce papier. Je vous tiens au courant.