Logiciel SPPAS récompensé lors de la remise des « Prix science ouverte du logiciel libre de la recherche »

Nous avons le plaisir de vous annoncer que le logiciel d’annotation automatique SPPAS, développé par Brigitte Bigi, chargée de recherche CNRS au LPL, figure parmi les dix logiciels récompensés à l’occasion des Journées européennes de la science ouverte (OSEC 2022, 4-5 février 2022).

C’est pour la toute première année et dans le cadre du deuxième Plan national pour la science ouverte que le ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation a organisé une remise de Prix science ouverte du logiciel libre de la recherche.

Logiciel SPPAS :

SPPAS est un logiciel de linguistique computationnelle et de linguistique de corpus. Depuis sa création en 2011, SPPAS est devenu l’outil de référence en terme d'annotation automatique de l'oral. Il permets entre autres :

  1. l'enrichissement du corpus avec des annotations qui sont générées automatiquement,
  2. l'analyse assistée des annotations, et
  3. la conversion de fichiers d'annotations depuis et vers différents formats pour assurer l'interopérabilité avec les logiciels d'annotation manuelle (e.g. Praat, Elan, ...).

Le logiciel, ou l'une de ses parties, a d’ores et déjà fait l'objet de 29 publications et a été téléchargé près de 1800 fois en 2021 par des utilisateurs provenant majoritairement de Chine, France et Etats-Unis.

Site Web : http://www.sppas.org/
Contact : brigitte.bigi@lpl-aix.fr

Article CNRS : OSEC 2022 : la science ouverte à l’heure européenne | CNRS

Corpus oraux : nouvelles réflexions méthodologiques et réglementaires

La revue CORPUS a publié dans son dernier numéro thématique « Du recueil à l’outillage des corpus oraux : comment accéder à la variation ? » deux articles (co-)écrits par plusieurs membres du LPL :

Le 1er article est né d’une initiative fédératrice de plusieurs acteurs nationaux autour des corpus de parole pathologique dans un cadre de phonétique clinique. Sept centres sont représentés : Aix, Marseille, Toulouse, Montpellier, Paris, Strasbourg, Avignon. L’objectif est de jeter les bases de la constitution de bases de données relatives aux troubles de la voix et de la parole pour faciliter la recherche sur ces thématiques dans lesquelles le recueil doit être important pour tenir compte des variations importantes des symptômes chez les malades :

Alain Ghio, Gilles Pouchoulin, François Viallet, Antoine Giovanni, Virginie Woisard, Lise Crevier-Buchman, Fabrice Hirsch, Camille Fauth et Corinne Fredouille, « Du recueil à l’exploitation des corpus de parole « pathologique » : comment accéder à la variation physiopathologique ? », Corpus [En ligne], 22 | 2021. URL : http://journals.openedition.org/corpus/5677

Le 2e article est le fruit des travaux menés par la commission Ethique du laboratoire concernant les nouvelles réglementations des corpus (RGPD et la Loi Jardé) :

Muriel Lalain, Gilles Pouchoulin, Béatrice Priego-Valverde et Serge Pinto, « De la protection des données à la protection de la personne : Réflexions sur l’impact des nouvelles réglementations sur la collecte des corpus », Corpus [En ligne], 22 | 2021. URL : http://journals.openedition.org/corpus/5895

Lien vers le Numéro 22 (2021) de Corpus

Crédits image : ANR Speed-Vel / LPL