Séminaire Étienne Thoret

Séminaire présenté par

Étienne Thoret

(PRISM, LIS, ILCB)

The different facets of timbre: toward a data-driven modelling of sounds

Dans le cadre de la réunion de l'équipe Physiologie et Organisation de la Parole (POP)

 

Abstract (EN):

Although extensively studied for years, defining the timbre of sounds remain unclear and controversial. Unraveling what makes musical and speech sounds timbre so special and expressive remains unclear. I hereby address these questions by using representations of sounds inspired by hearing processes - so-called spectro-temporal modulation representations - as front-end representations to machine learning techniques - interpretable - used to model specific auditory tasks or acoustic classifications. In this presentation, I will present two specific studies: (1) a meta-analysis of 17 former experiments on the auditory perception of musical instruments timbre showing that humans use both generic and context-driven acoustical cues when hearing musical sounds (2) a study on the impact of sleep deprivation on speech acoustic properties stressing the crucial interest to interpret machine learning classifiers. The results of these two studies support that modelling sounds needs the development of adequate - data-driven - representations.

Titre et résumé en FR :

Les différentes facettes du timbre : vers une modélisation des sons basée sur les données

Bien que largement étudiée pendant des années, la définition du timbre des sons reste peu claire et controversée. Il est difficile de comprendre ce qui rend le timbre des sons musicaux et vocaux si spécial et expressif. J'aborde par la présente ces questions en utilisant des représentations de sons inspirées des processus auditifs - des représentations dites de modulation spectro-temporelle - comme paramétrisation de techniques d'apprentissage automatique - interprétables - utilisées pour modéliser des tâches auditives spécifiques ou des classifications acoustiques. Dans cette présentation, je présenterai deux études spécifiques: (1) une méta-analyse de 17 expériences antérieures sur la perception auditive du timbre d'instruments de musique montrant que les humains utilisent à la fois des signaux acoustiques génériques et contextuels lorsqu'ils entendent des sons musicaux (2) une étude sur l'impact de la privation de sommeil sur les propriétés acoustiques de la parole soulignant l'intérêt crucial d'interpréter les classificateurs d'apprentissage automatique. Les résultats de ces deux études soutiennent que la modélisation des sons nécessite le développement de représentations adéquates et basées sur les données.

 

Séminaire Emilie Lebreton

Séminaire proposé par

Emilie Lebreton (LPL/AMU)
L'appropriation du français par des personnes migrantes : dispositifs, enjeux et perspectives de recherche et de formation

Dans le cadre de la réunion de l'équipe de recherche INTERACTIONS

Séminaire Jocelyn Aznar

Séminaire

Jocelyn Aznar

(Jeune docteur en sciences du langage, EHESS-CREDO, Marseille)

Narrer une nabol : La production des textes nisvais en fonction de l’âge et de la situation d’énonciation, Malekula, Vanuatu

Résumé :

Cette présentation portera sur la production des nabol, des pratiques narratives de la communauté linguistique nisvaie, située dans le sud-est de Malekula, au Vanuatu. S’appuyant sur la demande de locuteurs nisvais afin que des ressources langagières soient produites pour l’école locale, un corpus de textes oraux a été constitué pour montrer que les nabol sont produites en fonction de la situation d’énonciation et d’enjeux sociaux locaux liés à la classe d’âge de l’orateur.

Le corpus de textes oraux annotés résulte de séjours de recherche réalisés entre 2011 et 2015, totalisant 14 mois de terrain au sein de la communauté nisvaie. Les nabol sont étudiées d’une part, à l’aide des concepts issus de la linguistique textuelle afin de décrire les procédés discursifs employés par les locuteurs nisvais. À partir de ces procédés, il a été possible de comparer l’organisation des nabol et de mettre en évidence des variations significatives en fonction de la situation d’énonciation. D’autre part, l’observation participante et des entretiens dirigés ont permis d’identifier des enjeux sociaux que les locuteurs nisvais associent à leurs pratiques narratives. L’emploi des noms propres de personnages ou de lieux lors de la narration répond à un régime de vérité. En fonction de sa classe d’âge, l’orateur doit nommer ou non les personnages qui prennent part à l’intrigue au risque de se faire critiquer par ses pairs.

Les pratiques et normes issues du programme de documentation des langues à travers le monde et du traitement automatique des langues ont fourni des outils pour élaborer des ressources langagières pertinentes à l’étude des narrations et à son utilisation par la communauté nisvaie. Deux ressources papier ont été produites dans cette optique : un lexique bilingue nisvai- français et un recueil bilingue des textes du corpus, conçues pour les locuteurs nisvais et leur école francophone. De plus, deux ressources accessibles en ligne, une interface de lecture-écoute des textes et une interface de consultation des annotations ont été développées pour communiquer les travaux aux chercheurs travaillant sur des pratiques narratives orales ou les langues du Vanuatu.

Présentation de Thibault Cattelain

A l’occasion de sa prochaine réunion lundi 7 octobre, l’équipe POP accueillera Thibault Cattelain du Gipsa-Lab pour une conférence à partir de 16h.

Cette rencontre est ouverte à toutes et à tous, venez nombreux !

 

Thibault Cattelain

(Gipsa-Lab, Grenoble)

Une nouvelle technique pour analyser les signaux électromyographiques pendant une tâche de perception émotionnelle

Résumé :

L’électromyographie de surface (EMG) est une technique de mesure physiologique classique en production de parole et de mouvements orofaciaux. En revanche, lorsque l’on parle de mouvements induits par la perception d’émotion, les patrons d’activation musculaire sont d’amplitudes très faibles (i.e micro-activations). Nous proposons une nouvelle technique, simple et statistique, pour analyser les signaux EMGs acquis sur les muscles orofaciaux au cours de la perception de la joie et de la tristesse.

Séminaire inter-équipes : POP et SystUs

Programme

9h20 Présentation du séminaire

9h30-9h50 : LeAnn Brown (SystUs) & Claire Pillot-Loiseau (LPP)
Gender Neutralizing One’s Voice: Voice Quality and Non-binarity / Neutralisation du Genre par la Voix: Qualité Vocale et Non-Binarité

9h50 – 10h10 : Alexia Mattei (POP)
Comment parle-t-on avec une corde vocale paralysée ?

10h10 – 10h30 : Joana Révis (POP)
Voix et émotions

10h30 – 10h50 : Pause café

10h50 – 11h10 : Gaëlle Planchenault (SystUs)
Qualité des voix : des voix de qualité dans les médias ?

11h10 – 11h30 : Médéric Gasquet-Cyrus (SystUs), Alain Ghio (POP) & Gilles Pouchoulin (POP)
Voix et identité du locuteur

11h30-12h : Discussion générale

Séminaire Fidelia Ibekwe

Séminaire

Vendredi 29 novembre, 10h30
Laboratoire Parole et Langage, salle de conférences B011

Fidelia Ibekwe (IMSIC)

Analyse automatique des corpus textuels et appropriation de la science dans l'espace public

https://www.fideliaibekwe.info/
https://cv.archives-ouvertes.fr/fidelia-ibekwe-sanjuan

Après une présentation de mon parcours académique résolument pluridisciplinaire (Littérature, Sciences de l’information, Linguistique et IA), j’articulerai mon exposé sur 3 axes de recherche autour desquels mes travaux de recherche peuvent se regrouper, à savoir :

  1. Dispositifs : Acquisition de connaissances à partir de textes.
  2. Réflexivité : Fondements théoriques et épistémologiques de Library & Information Science
  3. Usages : Enjeux sociétaux des Big Data, Open Data, Digital Humanities et Open Science

Chaque axe de recherche sera illustré par des exemples d’études et d’applications, par des projets de recherche et des publications.

Je terminerai en présentant quelques pistes de collaborations futures sur les thématiques de (Big) Data Literacy, Open Data et Open Science et des Digital Humanities.

Séminaire de Dominic Watt

Séminaire
Dominic Watt (University of York)

3 juin 2019, 14h au Laboratoire Parole et Langage

Sounds familiar! Identifying individual talkers is easier if they have the same local accent as the listener

Accent familiarity is known to affect the accuracy with which listeners identify individual talkers in speaker identification tasks. Speakers with familiar regional accents are identified more reliably by listeners than are speakers who use less familiar accents (the so-called ‘other-accent effect’), in the same way that listeners are poorer at identifying speakers of unfamiliar foreign languages than familiar ones (the ‘language familiarity effect’). In this talk, I describe an experiment designed to investigate whether the other-accent effect is observed when listeners are asked to identify speakers of localised subvarieties of a regional accent, that of the North-East of England (Braun et al. 2018). Listeners from the cities of Newcastle upon Tyne, Sunderland and Middlesbrough heard one of three target-present voice parades composed of samples of the speech of people from the same three locales. Target speakers from the same city as the listener were identified correctly significantly more often than were speakers of the other two accents, revealing that the ‘other-accent’ effect holds even across very small geographical distances (Newcastle and Sunderland are only 17km apart, for instance). I discuss the implications of this finding for the construction of voice parades in forensic cases where the witness has a different local accent from that of the suspect and foils whose speech is represented in the parade.

Reference
Braun, A., Llamas, C., Watt, D., French, P. & Robertson, D. (2018). Sub-regional ‘other-accent’ effects on lay listeners’ speaker identification abilities: A voice line-up study with speakers and listeners from the North East of England. International Journal of Speech, Language and the Law 25(2): 231-255.

Séminaire inter-équipe REaDY & Interactions

Séminaire inter-équipe Interactions & REaDY

Vendredi 28 juin 2019
LPL – Salle de conférence B011

Programme

9h30 – A. Michelas & M. Champagne Lavau : Est-ce qu’on tient compte de notre interlocuteur dans nos choix linguistiques ? Le cas du focus contrastif en français
10h00 – N. Gala & C. David : De la complexité des textes à sa transposition didactique dans une classe de FLE multilingue : travaux exploratoires
10h45 – Pause-café
11h15 – K. Strijkers & N. Nguyen : Words in the speaker and listener’s mind: from individual to social level

[Réservé aux membres du LPL]
12h00 – Bilan annuel du LPL
12h30 – Déjeuner