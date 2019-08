Pour réaliser cette étude, les chercheurs ont donc analysé, à l’aide de l’apprentissage automatique, 3,5 millions de livres, tout genre confondus et publiés en anglais entre 1900 et 2008. Au total, 11 milliards de mots ont été passés au peigne fin.

Ils ont ainsi découvert que les hommes sont généralement décrits par des mots qui font référence au comportement, les femmes, elles, sont associées à l’apparence physique. "Belle" et "sexy" sont les plus fréquemment utilisés pour décrire les femmes. Pour les hommes, on retrouve les mots "juste", "rationnel" et "courageux", peut-on lire sur le site internet de l’université de Copenhague.

"Les femmes sont belles, les hommes rationnels" dans la littérature. Voici la conclusion d’un groupe d’informaticiens de l’Université de Copenhague et de chercheurs américains, qui ont analysé 3,5 millions de livres à l’aide de l’apprentissage automatique. Il s’agit de la capacité d’une machine à apprendre sur base de données. Elle va les analyser pour ensuite prendre des décisions et s’adapter.

Ils ont ensuite extrait les adjectifs et les verbes associés au genre : "hôtesse de l’air sexy", "bavardage entre filles", donnent-ils en exemple. Finalement ils ont analysé si ces mots dégageaient un sentiment positif, négatif ou neutre, et dans quelles catégories ils pouvaient être divisés : corps, comportement, sentiment,…

Le top 11 des adjectifs les plus utilisés et divisés en catégories. - © ALEXANDER HOYLE ET AL.

Selon les chercheurs, les verbes négatifs associés au corps et à l’apparence sont utilisés cinq fois plus souvent chez les femmes que chez les hommes.

Même constat pour les adjectifs positifs et neutres relatifs au corps et à l’apparence, ils apparaissent environ deux fois plus souvent dans les descriptions des femmes. Les hommes, eux, sont plus souvent décrits à l’aide d’adjectifs faisant référence à leur comportement et à leurs qualités personnelles.

L’importance des adjectifs

Les scientifiques ont voulu ainsi montrer que la littérature joue toujours un rôle dans la diffusion des stéréotypes et de la discrimination fondée sur le sexe, en particulier dans l’apprentissage automatique. Les algorithmes utilisés pour créer des machines et applications pouvant comprendre le langage humain sont alimentés en données sous forme de texte disponible en ligne.

"Les algorithmes permettent d’identifier des modèles, et chaque fois que l’un d’entre eux est observé, il perçoit que quelque chose est "vrai"", a déclaré Isabelle Augenstein de l’Université de Copenhague. "Si l’un de ces modèles fait référence à un langage biaisé, le résultat sera également biaisé."

En bref, la machine va se baser sur le langage que nous utilisons (dans la littérature par exemple) et donc véhiculer nos stéréotypes et préjugés.

"Si le langage utilisé pour décrire les hommes et les femmes diffère, par exemple dans les recommandations d’employés, les personnes qui se verront offrir un emploi seront influencées par le fait que les entreprises utilisent les systèmes informatiques pour trier les candidatures", a-t-elle encore précisé.

Les chercheurs soulignent cependant que cette analyse a ses limites. Elle ne fait par exemple pas la différence entre les genres, s’il s’agit d’un roman d’amour, de fiction, policier,…