La post-vérité passée au crible du big data

 

Selon une étude informatique portant sur des millions de livres, depuis plusieurs décennies le vocabulaire rationnel diminue au profit du vocabulaire émotionnel. Plusieurs experts soulignent les limites d’une telle approche globale.

Par Laure Belot

 15 juin 2022

 

« Post-vérité : nom féminin. Concept selon lequel nous serions entrés dans une période appelée ère de la post-vérité où l’opinion personnelle, l’idéologie, l’émotion l’emportent sur la réalité des faits. » Depuis que « post-vérité » a fait son entrée dans les dictionnaires – 2016 pour l’anglophone Oxford, 2018 et 2019 respectivement pour Le Robert et le Larousse dont la définition est donnée ci-dessus –, les débats scientifiques se multiplient. Comment se positionner face à ce phénomène sociétal flou et non précisément daté, que l’on associe tout autant à l’émergence des réseaux sociaux, l’élection de Donald Trump ou encore au vote du Brexit ?

En France, le Comité national d’éthique du CNRS s’est autosaisi et a publié un avis le 12 avril 2018 : « Quelles nouvelles responsabilités pour les chercheurs à l’heure des débats sur la post-vérité ? » A l’occasion de ses 30 ans, l’Institut universitaire de France s’est interrogé, en octobre 2021 : « Post-vérité ? La question de la crédibilité de la recherche scientifique à l’heure des faits alternatifs », etc. Et si la science des algorithmes et des données massives pouvait apporter sa pierre au débat ?

C’est le parti pris d’une équipe de scientifiques multidisciplinaires des universités néerlandaise et américaine de Wageningen et de l’Indiana. Pour matière première, cette équipe a utilisé des millions de livres en anglais et en espagnol couvrant la période de 1850 à 2019, numérisés et rendus accessibles par l’application linguistique de Google Ngram Viewer. « La montée en puissance de l’argumentation politique post-vérité, qui a pris la société par surprise, suggère que nous vivons une période historique particulière concernant l’équilibre entre émotion et raisonnement, expliquent en introduction les auteurs de l’étude (PNAS, décembre 2021) . Pour explorer si c’est effectivement le cas, nous avons analysé le langage dans des millions de livres, romans ou essais. » En partant des cinq mille mots les plus utilisés dans chacune des deux langues, leur approche a été celle de l’analyse en composantes principales (ACP), qui permet statistiquement de tirer des tendances.

Périodes linguistiques distinctes

Les résultats de cette recherche permettent de dessiner, courbes à l’appui, deux périodes linguistiques distinctes : entre 1850 et 1980 environ, la fréquence d’utilisation de mots associés à la rationalité, tels « déterminer », « conclusion », « analyse », etc., a systématiquement augmenté tandis que celle de mots à connotation sentimentale ou liés à l’expérience humaine, tels « ressentir », « croire », « imaginer », etc., baissait. Ce schéma s’est inversé dans les années 1980, puis même accéléré en 2007 lorsque la fréquence des mots liés aux faits a chuté tandis que le langage chargé d’émotion a crû.

Autre changement notable et parallèle, les chercheurs ont mis en lumière le passage d’une orientation collectiviste à une veine individualiste dans les livres étudiés, d’une société du « nous » à une société du « je ». Ce point est montré, entre autres, par l’évolution du rapport entre les fréquences des pronoms singuliers et pluriels dans les textes tels que « je »/« nous » et « il »/« ils », qui baisse puis augmente ces dernières décennies.

Pour vérifier que ces tendances n’étaient pas liées à leur seule approche livresque, les scientifiques ont appliqué cette analyse statistique à d’autres sources de vocabulaire tels les mots utilisés dans le New York Times depuis 1850, et les recherches faites plus récemment sur le site Google. Dans les deux cas, ils ont obtenu des réponses similaires. Même si des biais induits, notamment par le choix des livres numérisés et celui des mots, existent, reconnaissent les chercheurs, « cela soutient l’idée que les changements dans le langage des livres reflètent en partie les changements d’intérêt ».

Les auteurs se veulent prudents quant à l’interprétation des résultats. Sur la période 1850-1980, « déduire les moteurs des tendances observées à long terme reste nécessairement spéculatif, notent-ils. Il est possible que les développements rapides de la science et de la technologie et leurs avantages socio-économiques aient conduit à une montée en puissance de l’approche scientifique, qui a progressivement imprégné la culture, la société et ses institutions, de l’éducation à la politique ». En revanche, estiment-ils, « dans l’ensemble, nos résultats suggèrent qu’au cours des dernières décennies, l’intérêt public s’est nettement déplacé du collectif vers l’individuel, et de la rationalité vers l’émotion ». Un changement qui apparaît plus profond qu’une seule conséquence de l’avènement récent du numérique dans nos vies.

L’esprit d’une société

Qu’apporte cette approche algorithmique au débat ? Alain Finkel, professeur de sciences cognitives à l’ENS de Paris-Saclay, chercheur en informatique et en psychologie, estime que « l’approche statistique, sérieuse, ouvre sur une question intéressante qui reste néanmoins à traiter : “Quel est l’esprit d’une société ?” » On sait scientifiquement depuis une cinquantaine d’années que pensées et émotions sont intimement imbriquées, poursuit l’auteur du Manuel d’analyse cognitive des émotions (Dunod, 320 pages, 30 euros). « L’opposition qui est ici soulignée entre rationalité et émotion paraît trop caricaturale. Nous assistons plutôt, me semble-t-il, à une opposition entre pensée rapide et pensée lente telle que l’a souligné le Prix Nobel d’économie Daniel Kahneman. Nous ne sommes plus entraînés à prendre le temps de réfléchir en profondeur. Et parallèlement, nous sommes sociétalement plus libérés et même encouragés à exprimer nos ressentis. »

L’usage des données massives comme outil précis de compréhension de la société laisse circonspect l’historien des sciences Stéphane Van Damme. « Dans cette étude, on se trouve dans un temps indéterminé, entre le XIXe siècle et aujourd’hui. On ne sait pas vraiment d’où on parle », estime-t-il. Pour ce professeur à l’ENS, contributeur du supplément « Science & médecine » du Monde, « en produisant ces grandes tendances quantitatives, on a l’impression qu’il n’y a plus d’acteurs. Il faut réintroduire de la sociologie, de l’anthropologie, de l’histoire car la science est une production collective. Avec des normes qui dépendent de la société et de la politique. Ces normes diffèrent aujourd’hui de celles du XIXe ou du XVIIe siècle ».

Un point de vue que rejoint l’historienne Laurence Fontaine, spécialiste du passage entre les époques préindustrielle et contemporaine. « Cette approche globale moyennise une tendance dont il est difficile de comprendre réellement la pertinence. Elle ne prend guère en compte les transformations du langage, les modifications des médias utilisés et des segmentations de la société au cours des trois siècles sur lesquels court l’étude », commente-t-elle.

Cette chercheuse, qui a déjà utilisé des données massives de vocabulaire du XVIIIe siècle pour étudier « des liaisons entre les notions de crédit et d’honneur », ne défend pas une vision passéiste de sa discipline. Concernant le concept de post-vérité, que les auteurs cherchent à cerner à l’aide du big data, elle ajoute : « Cette étude peut être vue comme un test qu’il va falloir sophistiquer avec un corpus adapté pour mesurer de façon plus fine le rôle des émotions en démocratie et dans la vie publique. »

Laure Belot

Collé à partir de <https://www.lemonde.fr/sciences/article/2022/06/15/la-post-verite-passee-au-crible-du-big-data_6130412_1650684.html>