Ontologie et Outils Pour l’Annotation des Interventions Politiques
L’objectif du projet OOPAIP est d’analyser les interactions entre journalistes et personnalités politiques à partir d’un corpus d'émissions politiques de type interviews télévisés et radiophoniques et de mettre au point des modèles d’annotation permettant d’asseoir ces analyses sur un corpus représentatif.
Le corpus actuel contient une centaine d’émissions issues d’un échantillonnage de matinales de France Inter, de RTL, d’émissions “Les 4 Vérités” de France 2 et “BFM Direct” de BFM-TV.
Une annotation manuelle systématique a été effectuée par les partenaires chercheurs en sciences politiques du CESSP sur la quasi-totalité du corpus actuel ; cette annotation porte sur plusieurs axes : thématiques “politiques” , événements de discours (typologie d’interruptions) et rôles d’attribution (”Le militant, le présidentiable, l’expert,…) . Ces annotations très fines ont été réalisées en utilisant notre logiciel Okapi.
Une vérité terrain de diarisation portant sur une vingtaine d’interviews a également été réalisée en début de projet.
L’objectif “machine learning” est de mettre au point, à partir de ces annotations, des modèles permettant d’annoter automatiquement ou semi-automatiquement un corpus plus conséquent. Le projet s’intéresse également aux modalités de recueil des annotations et notamment à la gamification de ce processus.
Partenaires du projet : CESSP de Paris 1, le Laboratoire Interdisciplinaire des Sciences du Numérique LISN, la société “Game in Society”
Description du projet sur le site du CESSP
Membres du projet
Steffen Lalande (responsable du projet), Abdelkrim Beloued (chercheur), Agnès Saulnier (chercheuse)