Séminaire Archives - Page 8 sur 10 - Laboratoire Parole et Langage

Séminaire Laurent Besacier (LIG)

Une introduction à la documentation des langues assistée par la machine: illustration par le projet BULB

Par Laurent Besacier du Laboratoire d'Informatique de Grenoble (LIG) In this talk, I will introduce computational language documentation which is an emerging interdisciplinary field where linguistics leverage machine learning in order to help language documentation. First contributions on this topic were done during the BULB* project which addressed oral Bantu languages. I will present some insights of BULB in this talk: (1) how to ease or speed up speech data collection using mobile apps (2) how to leverage neural sequence-to-sequence models for automatic data processing and analysis. *BULB: Breaking the Unwritten Language Barrier

ANNULE | Séminaire inter-équipes : REaDY et POP

Séminaire Clément François

Séminaire Étienne Thoret

Séminaire présenté par

Étienne Thoret

(PRISM, LIS, ILCB)

The different facets of timbre: toward a data-driven modelling of sounds

Dans le cadre de la réunion de l'équipe Physiologie et Organisation de la Parole (POP)

Abstract (EN):

Although extensively studied for years, defining the timbre of sounds remain unclear and controversial. Unraveling what makes musical and speech sounds timbre so special and expressive remains unclear. I hereby address these questions by using representations of sounds inspired by hearing processes - so-called spectro-temporal modulation representations - as front-end representations to machine learning techniques - interpretable - used to model specific auditory tasks or acoustic classifications. In this presentation, I will present two specific studies: (1) a meta-analysis of 17 former experiments on the auditory perception of musical instruments timbre showing that humans use both generic and context-driven acoustical cues when hearing musical sounds (2) a study on the impact of sleep deprivation on speech acoustic properties stressing the crucial interest to interpret machine learning classifiers. The results of these two studies support that modelling sounds needs the development of adequate - data-driven - representations.

Titre et résumé en FR :

Les différentes facettes du timbre : vers une modélisation des sons basée sur les données

Bien que largement étudiée pendant des années, la définition du timbre des sons reste peu claire et controversée. Il est difficile de comprendre ce qui rend le timbre des sons musicaux et vocaux si spécial et expressif. J'aborde par la présente ces questions en utilisant des représentations de sons inspirées des processus auditifs - des représentations dites de modulation spectro-temporelle - comme paramétrisation de techniques d'apprentissage automatique - interprétables - utilisées pour modéliser des tâches auditives spécifiques ou des classifications acoustiques. Dans cette présentation, je présenterai deux études spécifiques: (1) une méta-analyse de 17 expériences antérieures sur la perception auditive du timbre d'instruments de musique montrant que les humains utilisent à la fois des signaux acoustiques génériques et contextuels lorsqu'ils entendent des sons musicaux (2) une étude sur l'impact de la privation de sommeil sur les propriétés acoustiques de la parole soulignant l'intérêt crucial d'interpréter les classificateurs d'apprentissage automatique. Les résultats de ces deux études soutiennent que la modélisation des sons nécessite le développement de représentations adéquates et basées sur les données.

Séminaire Emilie Lebreton

Séminaire Jocelyn Aznar

Séminaire

Jocelyn Aznar

(Jeune docteur en sciences du langage, EHESS-CREDO, Marseille)

Narrer une nabol : La production des textes nisvais en fonction de l’âge et de la situation d’énonciation, Malekula, Vanuatu

Résumé :

Cette présentation portera sur la production des nabol, des pratiques narratives de la communauté linguistique nisvaie, située dans le sud-est de Malekula, au Vanuatu. S’appuyant sur la demande de locuteurs nisvais afin que des ressources langagières soient produites pour l’école locale, un corpus de textes oraux a été constitué pour montrer que les nabol sont produites en fonction de la situation d’énonciation et d’enjeux sociaux locaux liés à la classe d’âge de l’orateur.

Le corpus de textes oraux annotés résulte de séjours de recherche réalisés entre 2011 et 2015, totalisant 14 mois de terrain au sein de la communauté nisvaie. Les nabol sont étudiées d’une part, à l’aide des concepts issus de la linguistique textuelle afin de décrire les procédés discursifs employés par les locuteurs nisvais. À partir de ces procédés, il a été possible de comparer l’organisation des nabol et de mettre en évidence des variations significatives en fonction de la situation d’énonciation. D’autre part, l’observation participante et des entretiens dirigés ont permis d’identifier des enjeux sociaux que les locuteurs nisvais associent à leurs pratiques narratives. L’emploi des noms propres de personnages ou de lieux lors de la narration répond à un régime de vérité. En fonction de sa classe d’âge, l’orateur doit nommer ou non les personnages qui prennent part à l’intrigue au risque de se faire critiquer par ses pairs.

Les pratiques et normes issues du programme de documentation des langues à travers le monde et du traitement automatique des langues ont fourni des outils pour élaborer des ressources langagières pertinentes à l’étude des narrations et à son utilisation par la communauté nisvaie. Deux ressources papier ont été produites dans cette optique : un lexique bilingue nisvai- français et un recueil bilingue des textes du corpus, conçues pour les locuteurs nisvais et leur école francophone. De plus, deux ressources accessibles en ligne, une interface de lecture-écoute des textes et une interface de consultation des annotations ont été développées pour communiquer les travaux aux chercheurs travaillant sur des pratiques narratives orales ou les langues du Vanuatu.

Présentation de Thibault Cattelain

A l’occasion de sa prochaine réunion lundi 7 octobre, l’équipe POP accueillera Thibault Cattelain du Gipsa-Lab pour une conférence à partir de 16h.

Cette rencontre est ouverte à toutes et à tous, venez nombreux !

Thibault Cattelain

(Gipsa-Lab, Grenoble)

Une nouvelle technique pour analyser les signaux électromyographiques pendant une tâche de perception émotionnelle

Résumé :

L’électromyographie de surface (EMG) est une technique de mesure physiologique classique en production de parole et de mouvements orofaciaux. En revanche, lorsque l’on parle de mouvements induits par la perception d’émotion, les patrons d’activation musculaire sont d’amplitudes très faibles (i.e micro-activations). Nous proposons une nouvelle technique, simple et statistique, pour analyser les signaux EMGs acquis sur les muscles orofaciaux au cours de la perception de la joie et de la tristesse.

Séminaire inter-équipes : Interactions et SystUs

Programme :

9h30 Ouverture

9h45 Amélie Leconte et Emilie Lebreton La dimension sociale des interactions : un préalable à l’analyse des situations didactiques

10h15 Cristel Portes Variation des stratégies prosodiques des locuteurs dans un débat radiophonique.

10h45-11h pause

11h Marco Cappellini Alignement lexical et structurel dans les échanges synchrones écrits vs audiovisuels. Une exploration méthodologique

11h30 Laetitia Leonarduzzi Variation en anglais oral spontané: les inversions dans les interrogatives indirectes

12h fin

Séminaire inter-équipes : POP et SystUs

Programme

9h20 Présentation du séminaire

9h30-9h50 : LeAnn Brown (SystUs) & Claire Pillot-Loiseau (LPP)
Gender Neutralizing One’s Voice: Voice Quality and Non-binarity / Neutralisation du Genre par la Voix: Qualité Vocale et Non-Binarité

9h50 – 10h10 : Alexia Mattei (POP)
Comment parle-t-on avec une corde vocale paralysée ?

10h10 – 10h30 : Joana Révis (POP)
Voix et émotions

10h30 – 10h50 : Pause café

10h50 – 11h10 : Gaëlle Planchenault (SystUs)
Qualité des voix : des voix de qualité dans les médias ?

11h10 – 11h30 : Médéric Gasquet-Cyrus (SystUs), Alain Ghio (POP) & Gilles Pouchoulin (POP)
Voix et identité du locuteur

11h30-12h : Discussion générale

Séminaire Fidelia Ibekwe

Séminaire

Vendredi 29 novembre, 10h30
Laboratoire Parole et Langage, salle de conférences B011

Fidelia Ibekwe (IMSIC)

Analyse automatique des corpus textuels et appropriation de la science dans l'espace public

https://www.fideliaibekwe.info/
https://cv.archives-ouvertes.fr/fidelia-ibekwe-sanjuan

Après une présentation de mon parcours académique résolument pluridisciplinaire (Littérature, Sciences de l’information, Linguistique et IA), j’articulerai mon exposé sur 3 axes de recherche autour desquels mes travaux de recherche peuvent se regrouper, à savoir :

Dispositifs : Acquisition de connaissances à partir de textes.
Réflexivité : Fondements théoriques et épistémologiques de Library & Information Science
Usages : Enjeux sociétaux des Big Data, Open Data, Digital Humanities et Open Science

Chaque axe de recherche sera illustré par des exemples d’études et d’applications, par des projets de recherche et des publications.

Je terminerai en présentant quelques pistes de collaborations futures sur les thématiques de (Big) Data Literacy, Open Data et Open Science et des Digital Humanities.