14 December 2022

Soutenance de thèse Rita Hijazi

Simplification syntaxique de textes à base de représentations sémantiques exprimées avec DMRS

Soutenance de thèse

Rita Hijazi

(LPL/AMU et LIS/AMU)

Simplification syntaxique de textes à base de représentations sémantiques exprimées avec DMRS

sous la direction de Monsieur Bernard ESPINASSE et Madame Núria GALA

Mercredi 14 décembre 2022 de 14h à 17h30

Campus de St Charles, Marseille à la FRUMAM, la salle de séminaire du 2ieme étage

 

Jury :
Guy PERRIER (Rapporteur) ; PR émérite, Université de Lorraine
Marie CANDITO (Rapporteuse) ; MCF, Université Paris Cité
Alexis NASR (Président du jury) ; PR, Aix-Marseille Université
Amalia TODIRASCU (Examinatrice) ; PR, Université de Strasbourg
Bernard ESPINASSE (Directeur de thèse) ; PR, Aix Marseille Université
Núria GALA (Co-directrice de thèse) ; MCF, Aix Marseille Université

Résumé :
La simplification de textes consiste à transformer un texte en une version plus simple à lire et/ou à comprendre et plus accessible à un public cible, tout en conservant son information, son contenu et son sens originaux. On distingue quatre niveaux de simplification, lexical, syntaxique, morphologique et discursif, et différents systèmes de Simplification Automatique de Textes (SAT) ont été développés en tenant compte de ces niveaux. Cette thèse se concentre sur la simplification syntaxique de textes en anglais, une tâche pour laquelle les systèmes automatiques existants présentent certaines limites.
Pour les dépasser, nous proposons tout d’abord une nouvelle méthode de simplification syntaxique exploitant des dépendances sémantiques exprimées en DMRS (Dependency Minimal Recursion Semantics), une représentation sémantique profonde sous forme de graphes combinant sémantique et syntaxe. La simplification syntaxique consiste alors à représenter la phrase complexe en un graphe DMRS, transformer selon des stratégies spécifiques ce graphe en d’autres graphes DMRS qui généreront des phrases plus simples. Cette méthode permet la simplification syntaxique de constructions complexes, en particulier des opérations de division basées sur des appositives, sur des coordinations et sur des subordinations ; ainsi que la transformation de formes passives en formes actives.
Pour évaluer cette méthode, nous avons développé un système automatique de simplification syntaxique. Ce système, nommé GRASS, met en œuvre les stratégies spécifiques de transformation de graphes DMRS par des ensembles de règles en utilisant le système de réécriture de graphe GREW. Ce système de simplification automatique est évalué sur un corpus de référence spécifique à la simplification syntaxique de façon automatique puis en ayant recours à des experts humains.
Les résultats obtenus par ce système de simplification syntaxique sur ce corpus de référence sur les opérations de division de phrases surpassent ceux des systèmes existants du même type dans la production de phrases simples, grammaticales et conservant le sens, démontrant ainsi tout l’intérêt de notre approche de la simplification syntaxique à base de représentations sémantiques en DMRS.

14 December 2022, 14h0017h30
FRUMAM, Campus Saint Charles, Marseille

Prochains évènements