Prédire c’est comprendre : Un modèle neuro-cognitif du langage fondé sur la prédiction

Nous avons le plaisir de vous annoncer le séminaire « Prédire c'est comprendre : un modèle neuro-cognitif du langage fondé sur la prédiction » que Philippe Blache, directeur de recherche CNRS au LPL, propose ce vendredi 2 février au Collège de France.

Cette intervention aura lieu dans le cadre du cycle de séminaires intitulé « Apprendre les langues aux machines » et sera précédé d’un cours sur les « Multimodalités : TAL et images, TAL et parole » par Benoît Sagot (Chaire annuelle informatique et sciences numériques en partenariat avec Inria).

Le séminaire aura lieu en présentiel mais une rediffusion est prévue ensuite sur le site du Collège de France.

Lien vers le cycle : https://www.college-de-france.fr/fr/agenda/seminaire/apprendre-les-langues-aux-machines

___________

MISE A JOUR du 07 février !

Le séminaire a été enregistré et est disponible désormais en podcast :  https://www.college-de-france.fr/fr/agenda/seminaire/apprendre-les-langues-aux-machines/predire-est-comprendre-un-modele-neuro-cognitif-du-langage-fonde-sur-la-prediction

 

Image :
Pieter Brueghel l’Ancien, La Grande Tour de Babel, vers 1563, Kunsthistorisches Museum, Vienne (Autriche)
Copyright : Domaine public

Financement du projet ANR STAR-FLE

Nous avons le plaisir de vous annoncer la validation du projet « STAR-FLE : STrategic Adaptations for better Reading and Text Comprehension in FFL » par l’Agence Nationale de la Recherche. Porté par l’UR LiLPa (Linguistique, langues, parole) de l’Université Strasbourg, il compte parmi ses membres également Núria Gala, Catherine David et Paul Pouzergues du LPL.

Résumé :
Dans le domaine de l'enseignement des langues assisté par ordinateur (ELAO, ou CALL en anglais pour Computer Assisted Language Learning) il existe des outils innovants pour aider les apprenants dans leurs stratégies d’apprentissage. Cependant, peu d'outils efficaces sont proposés pour les enseignants dans leur pratique didactique, et notamment pour la didactique du lexique. Dans ce contexte, l’objectif du projet STAR-FLE est de mieux comprendre les difficultés des apprenants de français langue étrangère (FLE) face au lexique présent dans des textes authentiques. Nous proposerons des solutions numériques issues du traitement automatique des langues (TAL) facilitant la compréhension des textes et permettant aux enseignants de mieux gérer l’hétérogénéité de niveaux. Des aides contextuelles et des adaptations personnalisées du vocabulaire sont envisagées, notamment au niveau des expressions polylexicales. Le projet est financé pour 4 ans (2024-2027) avec un recrutement de post-doc pour 2 ans au LPL (début probable à la rentrée 2024).

Mots clés : didactique du FLE, lexique, enseignement des langues assisté par ordinateur, traitement automatique des langues.

Laboratoires impliqués : LiLPa (université de Strasbourg -porteur principal du projet), ATILF (Nancy), LPL (AMU) et CENTAL (Université catholique de Louvain, membre invité)

Crédit d’image : jcomp sur Freepik

Outstanding Paper Award pour Giulia Rambelli au 19e Workshop on Multiword Expressions

Giulia Rambelli vient d’obtenir le « Outstanding Paper Award » pour l’article scientifique intitulé « Are Frequent Phrases Directly Retrieved like Idioms? An Investigation with Self-Paced Reading and Language Models » dont elle est première auteure, aux côtés de Emmanuele Chersoni, Marco S. G. Senaldi, Philippe Blache and Alessandro Lenci. Le prix a été remis le 6 mai dernier à l’occasion du 19e Workshop on Multiword Expressions organisé dans le cadre de la conférence EACL 2023 à Dubrovnik (Croatie). La publication est par ailleurs étroitement liée à sa thèse réalisée sous la direction de Philippe Blache et Alessandro Lenci et soutenue en septembre 2022.

Actuellement, Giulia a rejoint l’équipe du projet ABSTRACTION, financé par Conseil Européen de la Recherche (ERC) et coordonné par Marianna Bolognesi à l’Université de Bologne, en Italie.

Félicitations, Giulia !

Résumé de l’article :
Une question ouverte dans les études sur la compréhension des langues est de savoir si les expressions multi-mots non compositionnelles telles que les expressions idiomatiques et les séquences de mots compositionnels mais fréquents sont traitées différemment. Ces dernières sont-elles construites en ligne ou sont-elles au contraire directement extraites du lexique, avec un degré d'enracinement dépendant de leur fréquence ? Dans cet article, nous abordons cette question à l'aide de deux méthodologies différentes. Tout d'abord, nous avons mis en place une expérience de lecture autonome comparant les temps de lecture humaine pour les expressions idiomatiques et les séquences de mots composites de haute et de basse fréquence. Ensuite, nous avons réalisé la même expérience en utilisant les mesures Surprisal calculées avec Modèles de Langue Neuronaux (MLN). Nos résultats prouvent que les expressions idiomatiques et compositionnelles à haute fréquence sont traitées de la même manière par les humains et les MLN. Des expériences supplémentaires ont été menées pour tester les facteurs susceptibles d'affecter les performances des MLN.

Best Paper Award de la conférence *SEM 2021

L'article Did the Cat Drink the Coffee? Challenging Transformers with Generalized Event Knowledge de Paolo Pedinotti, Giulia Rambelli (LPL), Emmanuele Chersoni, Enrico Santus, Alessandro Lenci et Philippe Blache (LPL) a reçu le prix du meilleur article de la Conférence *SEM 2021. La 10e conférence sur la sémantique lexicale et computationnelle se tiendra les 5 et 6 août. Toutes nos félicitations!

Plus d’infos :
*SEM 2021 Conference
Article sur Youtube

L’Institut Carnot Cognition valide le financement du projet “PATY”

Nous avons le plaisir de vous annoncer que Alain Ghio, ingénieur de recherche au LPL, vient d’obtenir un financement pour le projet de recherche « Plateforme de traitement de parole atypique (PATY) », sous la coordination de Jérôme Farinas de l’Institut de Recherche en Informatique de Toulouse (IRIT). Ce projet, soumis dans le cadre d’un appel d’offres de l’Institut Carnot Cognition dont le LPL est membre, vise à rendre accessibles les derniers résultats de recherche et de développement autour de la parole atypique (pathologies, accents régionaux…) et de créer un outil associant plusieurs méthodes d’analyse et de traitement automatique. La plateforme réalisée pourrait ensuite faire objet d’une valorisation auprès de la communauté de recherche spécialisée dans la cognition et le traitement de la parole ainsi que dans différents secteurs de la santé ou de l’industrie.

Best Paper Award : Giulia Rambelli, doctorante au LPL

Giulia Rambelli, doctorante au LPL sous la direction de Philippe Blache et de Alessandro Lenci (Pisa), vient d’obtenir le « Best Paper Award » pour l’article scientifique intitulé « Comparing Probabilistic, Distributional and Transformer-Based Models on Logical Metonymy Interpretation » dont elle est première auteure, aux côtés de P. Blache, E. Chersoni, A. Lenci et C.-R. Huang.

Le prix a été remis vendredi dernier à l’occasion de la conférence AACL-IJCNLP qui s’est tenue en ligne du 4 au 7 décembre (Suzhou, Chine). Félicitations, Giulia !

 

Résumé en français :

Comparaison de modèles probabilistes, de modèles de distribution et de modèles basés sur des transformers pour l'interprétation de la métonymie logique
En linguistique et en sciences cognitives, les métonymies logiques sont définies comme des conflits de types entre un verbe sélectionnant un événement et un nom  désignant une entité (par exemple, "l'éditeur a terminé l'article"). Les métonymies sont généralement interprétées en déduisant un événement caché (par exemple, la lecture) sur la base d'indices contextuels. Cet article aborde le problème de l'interprétation de la métonymie logique (c'est-à-dire la récupération de l'événement caché) par des méthodes de calcul. Nous comparons différents types de modèles, y compris les modèles probabilistes et les modèles de distribution précédemment introduits dans la littérature sur le sujet. Pour la première fois, nous avons également testé sur cette tâche certains des récents modèles basés sur des transformers, tels que BERT, RoBERTa, XLNet et GPT-2. Nos résultats montrent un scénario complexe, dans lequel les meilleurs modèles basés sur les transformers et certains modèles de distribution traditionnels ont des performances très similaires. Cependant, les faibles performances de certains jeux de données de test suggèrent que la métonymie logique reste un phénomène difficile pour la modélisation informatique.

________

Mise à jour 3 février 2021

Distinction de Giulia Rambelli mise en avant dans la Lettre d’AMU

Dans son dernier numéro de la Lettre d’AMU, Aix-Marseille Université a consacré une brève à Giulia Rambelli, doctorante au LPL, et la distinction reçue à l’occasion de la conférence AACL-IJCNLP en décembre dernier.

Lien vers la brève :  http://url.univ-amu.fr/lettreamu_janvier21_n85 (p. 23)

Voir article sur www.lpl-aix.fr : Best Paper Award : Giulia Rambelli, doctorante au LPL - Laboratoire Parole et Langage (lpl-aix.fr)

 

 

Les chercheur.se.s du LPL participent à la conférence JEP-TALN-RECITAL 2020

https://jep-taln2020.loria.fr/

L’incontournable rendez-vous quadriannuel consacré à l'étude de la parole et au traitement automatique des langues - la conférence JEP-TALN-RECITAL 2020 - a ouvert ses portes aujourd’hui ! Initialement prévu à Nancy, l’événement et se déroulera sur deux semaines complètement en mode virtuel, grâce à des pages dédiées aux articles et des forums de discussion.

Plusieurs chercheur.se.s et doctorantes du LPL ont répondu présent en proposant un large panel de sujets de recherche, dont par exemple :

Deux communications dédiées à l’évaluation de l’intelligibilité de patients traités du cancer des cavités orales et pharyngales (A. Ghio, M. Lalain, M. Rebourg, N. Fakhry avec C. Fredouille, V. Woisard) et une présentation sur la simplification de textes dans le cadre du traitement automatique des langues (R. Hijazi). De même, on y trouve trois études de perception : le voisement des fricatives chuchotées (Y. Meynadier, N. Nguyen, S. Dufour), l’impact de l’oreille de présentation sur la capacité de variation accentuelle (A. Michelas, S. Dufour) et les consonnes dans la dysarthrie parkinsonienne (D. Duez, A. Ghio, F. Viallet). Enfin, une présentation qui a pour but de quantifier les positions articulatoires théoriques lors de la production de la parole spontanée (C. Meunier, M. Peirolo, B. Bigi).

 

Articles JEP-TALN-RECITAL 2020 accessibles sur HAL :

Alain Ghio, Muriel Lalain, Marie Rebourg, Corinne Fredouille, Virginie Woisard. Evaluation de l'intelligibilité de patients avec traitement du cancer des cavités orales et pharyngales. Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 31e édition), Traitement Atomatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d'Études sur la Parole, Jun 2020, Nancy, France. pp.271-279. ⟨hal-02798549⟩
URL : https://hal.archives-ouvertes.fr/hal-02798549
-----------------------------------------------------------------------------

Marie Rebourg, Muriel Lalain, Alain Ghio, Corinne Fredouille, Nicolas Fakhry, et al.. Évaluer l'intelligibilité, mots ou pseudo-mots ? Comparaison entre deux groupes d'auditeurs. Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 31e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d'Études sur la Parole, Jun 2020, Nancy, France. pp.543-551. ⟨hal-02798584⟩
URL : https://hal.archives-ouvertes.fr/hal-02798584
-----------------------------------------------------------------------------

Rita Hijazi. Transformations syntaxiques entre niveaux de simplification dans le corpus Newsela. Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 31e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 3 : Rencontre des Étudiants Chercheurs en Informatique pour le TAL, Jun 2020, Nancy, France. pp.137-150. ⟨hal-02786194⟩
URL : https://hal.archives-ouvertes.fr/hal-02786194
-----------------------------------------------------------------------------

Yohann Meynadier, Noël Nguyen, Sophie Dufour. Interaction entre durée et position dans la perception des fricatives voisées chuchotées. Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 31e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d'Études sur la Parole, Jun 2020, Nancy, France. pp.442-450. ⟨hal-02798571⟩
URL : https://hal.archives-ouvertes.fr/hal-02798571
-----------------------------------------------------------------------------

Amandine Michelas, Sophie Dufour. Comment l'oreille de présentation affecte-t-elle la capacité des francophones à discriminer des contrastes accentuels natifs et non-natifs ?. Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 31e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d'Études sur la Parole, Jun 2020, Nancy, France. pp.463-471. ⟨hal-02798573⟩
URL : https://hal.archives-ouvertes.fr/hal-02798573
-----------------------------------------------------------------------------

Duez Danielle, Ghio Alain, François Viallet. Perception des consonnes dans la dysarthrie parkinsonienne : effets du contexte phonémique, prosodique et lexical. Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 31e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d'Études sur la Parole, Jun 2020, Nancy, France. pp.172-180. ⟨hal-02798533⟩
URL : https://hal.archives-ouvertes.fr/hal-02798533
-----------------------------------------------------------------------------

Christine Meunier, Morgane Peirolo, Brigitte Bigi. La mobilisation du tractus vocal est-elle variable selon les langues en parole spontanée ?. Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 31e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d'Études sur la Parole, Jun 2020, Nancy, France. pp.433-441. ⟨hal-02798569⟩
URL : https://hal.archives-ouvertes.fr/hal-02798569