Comment quantifier le bien-être d'une population en temps réel ? Traditionnellement, nous l'avons fait avec un mélange d'indicateurs économiques clés, mêlant le PIB aux indices de confiance des consommateurs.

Mais les gens sont-ils heureux ? Croient-ils que leurs vies — leurs histoires personnelles — se portent bien ? Ont-ils de l'espoir pour l'avenir?

Plus de deux milliards de personnes utilisent des réseaux sociaux tels que Twitter, WeChat, Facebook et Instagram pour communiquer. Ces échanges peuvent-ils être utilisés pour contribuer à construire une vitrine du bonheur collectif quotidien?

Le Computational Story Lab (co-dirigé par Peter & Chris) en collaboration avec d'autres groupes de recherche travaillent à développer un tel « hédonomètre » — un indicateur de bonheur en temps réel. Il utilise une mesure économique majeure, à savoir les données récoltées sur les réseaux sociaux.

Que révèlent nos Tweets à notre sujet ?

Nos analyses d'un sous-ensemble représentatif de tweets en langue anglaise révèlent que, tout au long de la journée, les gens utilisent les mots les plus joyeux sur Twitter le matin, avec des grossièretés de plus en plus fréquentes à mesure que le jour avance.

Nous voyons émerger un cycle hebdomadaire d’utilisation des termes. Le samedi a tendance à être le jour le plus heureux de la semaine, grâce à l’emploi des mots "amour", "famille", et "fun" utilisés le plus souvent. Les lundis et mardis sont les jours les plus faibles, avec moins de "hahaha", "génial ", et "jouer" que d’habitude.

L'attention collective de la société aux événements majeurs entraîne de grands pics et des accidents dans la courbe du bonheur. Les données américaines montrent que les jours fériés ont tendance à être nos jours les plus joyeux, avec Noël et Nouvel An en tête de gondole qui produisent plus d '«espoir», de «béni» et de «joie», mais aussi moins de «non» et de «détester». Des résultats similaires sont susceptibles d'apparaître à Bombay au moment de Diwali ou à Pékin lors du Nouvel An chinois. Nous semblons avoir besoin de célébrations organisées et structurées pour que les gens se rassemblent autour de la positivité.

De même, à une échelle inférieure, de grandes bases de fans explosent de bonheur lorsque leur équipe remporte un grand championnat sportif (par exemple, le Super Bowl aux États-Unis), alors que les tweets des fans perdants sont tristes et colériques.

Les jours les plus tristes coïncident avec les réponses à des événements d’actualité. Les catastrophes naturelles comme le tremblement de terre et le tsunami en Indonésie, les décès de célébrités comme ceux de Michael Jackson et les attentats terroristes comme ceux de Paris ont tous conduit à des jours extrêmement négatifs. Les données issues des réseaux sociaux et récoltées en fonction de leur géographie permettent de limiter cette analyse à des zones géographiques spécifiques telles qu'une ville ou un État.

Timeseries quotidiennes du bonheur dans les tweets en anglais, basées sur 10% aléatoire des messages postés dans le monde entier. Version interactive disponible sur http://hedonometer.org

Les réseaux sociaux peuvent-ils fournir des indices sur la santé de la population?

Les hédonomètres basés sur les réseaux sociaux offrent également de fortes corrélations avec certaines mesures traditionnelles de la santé et du bien-être.

Par exemple, dans une étude récente, des mots et des expressions spécifiques dans les tweets ont montré de fortes corrélations avec les taux d'obésité et de diabète aux États-Unis : les états où les gens ont tweeté sur la course, le ski et la randonnée. Dans une autre étude portant sur des tweets géolocalisés provenant d'environ 1.300 États américains, des tweets transmettant des émotions négatives (anxiété, hostilité) ont été corrélés avec les données sur les taux de mortalité cardiovasculaire pour ces mêmes comtés (fournis par les Centres de contrôle et de prévention des maladies). Une autre analyse de tweets postés par 1.400 utilisateurs ayant déclaré un Trouble déficit de l’attention a révélé que le groupe avait plus de messages sur le manque de concentration, l'autorégulation et les expressions d'épuisement mental, physique et émotionnel par rapport à un groupe témoin sans la maladie.

Les analyses des photos Instagram de 166 individus ont identifié avec succès des marqueurs de la dépression — les utilisateurs déprimés avaient tendance à publier des photos plus bleues et plus foncées (pixel par pixel) que les sujets non déprimés.

Et les chercheurs de Microsoft ont récemment rapporté que les requêtes des moteurs de recherche pouvaient identifier certains cas de cancer avant même que les gens aient reçu un tel diagnostic. L'un d'entre nous (Murali) travaille actuellement avec l'équipe de Microsoft pour déterminer si les phénotypes de recherche sur le Web (le modèle de recherche) peuvent fournir des indices sur les premiers symptômes de maladies du cerveau comme Parkinson et Alzheimer.

En affinant davantage, il est concevable que ces «marqueurs numériques» puissent servir de tableaux de bord de santé publique, offrant une source d'informations en temps quasi réel aux décideurs sur les impacts de leurs décisions.

Quels sont les pièges?

Il est clair que nous devons garder à l'esprit les leçons de la montée et de la chute de Google Flu Trends (GFT) — un algorithme pour prédire les taux de grippe basés sur les recherches sur Internet — malgré son succès initial (140%). Un post-mortem ultérieur a révélé que les algorithmes de GFT étaient susceptibles de «sur-ajuster» — donnant trop d’importance aux termes recherchés par hasard — et ne prenaient pas en compte les changements dans le comportement de recherche au fil du temps.

Les analyses de sentiment et d'humeur utilisant les réseaux sociaux en sont encore à leurs débuts. Le manque d'échantillons aléatoires, l'incapacité à faire des analyses de sentiment profondes (c'est-à-dire aller au-delà de ce que les gens pensent de sujets spécifiques) et déchiffrer les subtilités de centaines de dialectes indigènes sont quelques-uns des défis que les chercheurs tentent de relever.

Par conséquent, il est primordial que de tels instruments soient ajustables, évolutifs et transparents — et qu'ils ne reposent pas sur des algorithmes de boîte noire. Un partenariat public-privé peut être idéal pour valider, surveiller et affiner de tels instruments.

Et après ?

Le développement d'hédonomètres multilingues basés sur les réseaux sociaux, couvrant également d'autres langues telles que le mandarin, l'arabe, l'hindi et l'espagnol, pourrait permettre de détecter les changements émotionnels mondiaux en réponse à des événements tels que le Brexit, la Coupe du monde de football, des incendies, des essais nucléaires et des fluctuations des marchés financiers.

Une base de données à grande échelle basées sur les mots illustrant des émotions autres que le bonheur et la tristesse telles que la peur, la colère et la surprise permettrait d'incorporer ces émotions dans les futures versions de l'hédonomètre. Y compris le texte d'autres sources en ligne telles que Google ou Baidu (que les gens recherchent) et BBC, Xinhua ou Times of India (ce que les gens lisent) peuvent servir de différentes lentilles à travers lesquelles explorer les tendances sociétales.

Les agences de renseignement du monde entier ont déjà commencé à utiliser de tels outils, mais leurs données et algorithmes ne sont pas accessibles au public, ni encore exploitées. Nous croyons qu'il est temps d'établir un cadre éthique et scientifique pour ces instruments à l'usage du public. Nous sommes à la recherche de financement pour créer un tel cadre.

Alors que les réseaux sociaux continuent de révéler des idées plus précises sur notre comportement, nous cherchons à donner un sens aux habitudes, aux émotions et aux histoires que nous partageons les uns avec les autres. Tout comme l'invention des horloges et des thermomètres et des télescopes ont été pertinents dans de nombreux domaines scientifiques, la société devrait construire des instruments qui débloquent le pouvoir de la science pour décrire et expliquer les phénomènes sociaux, permettant ainsi des développements technologiques pour le bien des gens partout.