Gender Equality Monitor
Le projet GEM (ANR-19-CE38-0012) vise à décrire de manière automatique les différences de représentation et de traitement existant entre les femmes et les hommes dans les médias en langue française que sont la TV, la radio, la presse écrite et les collections musicales. L’ambition du projet est d’analyser plusieurs millions de documents échantillonnés sur une période de plus de 80 ans, pour réaliser la plus vaste étude portant sur la place des hommes et des femmes dans les médias.
La projet est porté par un consortium transdisciplinaire composé de deux acteurs majeurs de l’audiovisuel (INA, Deezer), deux laboratoires STIC spécialisés en extraction d’information automatique à partir du texte et de la parole (LIUM, LIMSI) et trois laboratoires SHS spécialisés dans l’étude du genre et des médias (CARISM, LERASS, ENS LYON). Il est également doté d’un comité d’experts sensibilisé aux retombées industrielles et sociales du projet composé du CSA, du DEPS et de Radio France.
L’approche envisagée pour décrire les différences de traitement entre les sexes repose sur trois axes de travail complémentaires :
- Le premier axe consiste à formaliser des descripteurs permettant de quantifier les différences de représentation. Ce travail sera effectué dans le cadre d’analyses qualitatives portant sur plusieurs corpus thématiques: incivilités liées au genre, cas limites de la binarité vocale, traitement des mouvements féministes par les médias, figure de la femme anonyme dans l’espace public, place accordée au corps. Une force du projet réside dans la complémentarité des méthodologies mobilisées pour analyser un matériau commun : analyse du discours, études de cas, études de réception, interview des acteurs, analyse prosodique des performances des locuteurs.
- Le deuxième axe de travail consiste à implémenter les descripteurs définis à l’aide de méthodes d’extraction d’information, fondées sur le traitement automatique du langage écrit et oral, la caractérisation du locuteur, du chanteur et des visages. Les problématiques soulevées par le projet GEM contribuent à orienter les recherches visant à améliorer les coeurs de technologie, plus particulièrement ceux liés à l’extraction d’informations sémantiques end-to-end directement depuis le signal audio, ou encore la régulation des biais (biais de genre par exemple) appris par les modèles automatiques propageant les stéréotypes véhiculés par leurs données d’entraînement.
- Le troisième axe de nature transverse consiste à réaliser des études quantitatives fondées sur l’exploitation des descripteurs obtenus automatiquement, via plusieurs phases d’expression de besoin et d’évaluation par l’usage. Cet axe comporte un certain nombre d’enjeux technologiques, notamment la capacité à traiter des volumes de données massifs et à les exploiter. Il répond aussi à des enjeux théoriques, car l’exploitation de cette masse de données inédite contribuera non seulement à créer de nouvelles connaissances en sciences humaines, mais aussi à formuler de nouvelles problématiques orientant les études qualitatives. L’étude des cas limites de sortie des algorithmes de classification devrait notamment permettre de questionner les critères utilisés pour cette classification en mettant en rapport les cas observés avec l’interprétation qu’il faudra en faire.
Ce projet répond à des enjeux scientifiques, aussi bien en SHS qu’en STIC, mais également industriels: estimation automatique de la représentation des sexes dans les programmes diffusés, exploration de collections numériques; et sociétaux: impact des politiques publiques d’égalité, mesure objective des différences de traitements susceptible d’éclairer le débat public . Les premiers résultats obtenus par l’INA fondés sur l’analyse du temps de parole des hommes et des femmes laissent supposer que les retombées du projet proposé pourraient avoir un fort impact social et médiatique et sont en phase avec les préoccupations citoyennes et les exigences contemporaines en matière d’égalité.
Les partenaires du projet : Institut national de l'audiovisuel (Ina), Deezer, Laboratoire d'Informatique de l'Université du Mans (LIUM), Centre d'Analyse et de Recherche Interdisciplinaire sur les Medias (Carism, Assas), Centre Max Weber (CMW), Laboratoire d'Etudes et de Recherches Appliquees en Sciences Sociales (LERASS), Laboratoire Interdisciplinaire des Sciences du Numérique (LISN)
Membres du projet
David Doukhan (responsable du projet), Rémi Uro (doctorant)