Quand les journalistes prédiront l’avenir

Albert Einstein

Albert Einstein

La modélisation mathématique et ses applications dans le domaine prédictif est un des sujets qui me passionnent particulièrement.

Ces modèles régissent nos vies, qu’ils soient appliqués à l’urbanisme – définir les vitesses à appliquer pour éviter les embouteillages, la nécessité de créer des routes de contournement pour désemcombrer un centre ville -, à la régulation des transports en commun, à l’amélioration de traitements médicaux, la bourse, la météo, la grande distribution, la politique, etc.

Appliquées au web ces théories peuvent produire des informations dignes de celles de la boule de Mme Irma !

Pour faire simple, s’il existe un moyen de recueillir un échantillon significatif d’information produit par un comportement et qu’il existe une puissance informatique suffisante pour que ce comportement soit analysé, alors il peut être modélisé.

Il est simple de comprendre qu’avec la « numérisation » de nos comportements – exprimer une émotion via un émoticone, solliciter la fonction j’aime, mettre 4 étoiles sur 5 pour un film, lancer des requêtes dans un moteur de recherche, habiter ici, manger là, être fan de, etc. – allant de paire avec la puissance croissante des ordinateurs et la croissance des espaces de stockage, on obtient un terrain favorable à la modélisation mathématique de tout comportement, y compris les comportements humains. Ces outils existent et sont aujourd’hui largement utilisés par les entreprises. Je vous renvoie pour approfondir ce sujet sur un brillant article : « Les Réseaux Sociaux, Instruments du prédictif de Denis Ettighoffer, du 4/04/2011″.

Pourquoi ne pas imaginer alors un modèle mathématique qui prédirait le succès d’un article de presse sur internet ?

C’est la question à laquelle trois chercheurs américains ont tenté de répondre. Ils ont publié le 2 février 2012 les premiers résultats d’une étude intitulée « The Pulse of News in Social Media: Forecasting Popularity ».

Ils ont recueilli des milliers d’articles sur plusieurs jours et ils ont mesuré « l’écho » – ou le « bruit » : reprise de l’article sur les réseaux soxiaux, mention de l’article dans les blogs ou les forums, etc. – de ces articles sur internet. Après avoir procédé à l’analyse des données, les chercheurs ont mis en lumière l’existence d’une modèlisation mathématique cohérente basée sur quatres variables : l’émetteur/ la source, la thématique/ le sujet, la nature du langage/ le vocabulaire employé et les noms cités (entreprises, marques, personnes, etc.).

Ce modèle prédit dans 80% des cas l’appartenance d’un article donné à l’un des trois ensembles constitués par le nombre de reprises de l’article sur Twitter : 1 à 20 fois, de 20 à 100 fois ou plus de 100 reprises. De plus on s’aperçoit qu’un pseudo Twitter très suivi – avec une forte notoriété – a parfois plus d’impact en qualité d’émetteur qu’un media reconnu. 

Cette étude ouvre la voie à de nouvelles investigations dans le domaine prédictif. La création  d’outils permettant à un journaliste de mesurer l’intérêt des lecteurs pour son article avant même de l’avoir publié n’est pas loin, avec les dérives qu’on imagine…

About Thierry Picard

Directeur Internet du groupe media La Nouvelle République du Centre Ouest. Intervenant pour le groupe Stratégies expertises ecommerce, ergonomie et emarketing
Média, Tempête de cerveau , , , ,

1 comment


  1. Pingback: FuturHebdo – nrblog.fr : Quand les journalistes prédiront l’avenir

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *


*

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>