Les événements du CRIM

Les Séminaires R-D sont des rendez-vous scientifiques sur les dernières avancées scientifiques et technologiques.
Les Journées Technos sont des rendez-vous où le monde de la recherche et le monde industriel se rencontrent pour échanger sur des thématiques émergentes.

Apprentissage de représentations interprétables et découplées pour la parole

Apprentissage de représentations interprétables et découplées pour la parole

Apprentissage de représentations interprétables et découplées pour la parole 

Présentation en français

CONFÉRENCIER

Gilles Boulianne, Ph. D.
Chercheur sénior en traitement automatique de la parole

RÉSUMÉ

Les représentations distribuées visent à extraire l’information de haut niveau contenue dans des données brutes et prennent habituellement la forme de vecteurs de faible dimension. Lorsqu’utilisées comme entrée pour des tâches de classification, elles réduisent la complexité du classificateur et facilitent l’apprentissage par transfert ainsi que l’adaptation au domaine. En traitement automatique des langues naturelles (TALN), des représentations telles que les plongements de mots ou de phrases (“embeddings”) sont devenues incontournables. En traitement de la parole, l’apprentissage de représentations sans supervision est aussi un sujet de recherche très actif. Dans cette présentation, le conférencier discutera des concepts d’interprétabilité et de découplage dans ces représentations et de la notion de biais inductif. Il présentera également quelques résultats récents obtenus avec un modèle génératif capable d’apprendre par lui-même une représentation interprétable et découplée, uniquement à partir d’enregistrements sonores, lorsqu’on lui impose des biais inductifs inspirés des théories acoustiques et articulatoires de production de la parole. 


Learning interpretable and decoupled representations for speech 

SPEAKER

Gilles Boulianne, Ph.D., Senior Researcher in Automatic Speech Processing

ABSTRACT

Distributed representations are intended to capture high-level information from raw data and usually take the form of low-dimensional vectors. When considered as input features for classification tasks, they reduce classifier complexity and facilitate transfer learning and domain adaptation. In natural language processing (NLP), representations such as word or phrase embeddings have become essential. In speech processing, unsupervised representation learning is also a very active research topic. In this presentation, the speaker will discuss the concepts of interpretability and disentanglement in these representations as well as the notion of inductive bias. He will also present some recent results obtained with a generative model capable of learning by itself an interpretable and disentangled representation, solely from sound recordings, when inductive biases inspired by acoustic and articulatory theories of speech production are imposed on it. 


Les séminaires scientifiques du CRIM, gratuits et ouverts à tous, sont donnés par des experts de renommée internationale, des collaborateurs universitaires, le personnel de R-D et les étudiants du CRIM. Au programme, des présentations conviviales sur les dernières avancées scientifiques et technologiques.


Conférence virtuelle. Gratuit, inscription obligatoire.

En vidéoconférence : l'hyperlien sera envoyé quelques jours avant la conférence.

Le 30 octobre 2020
De 11h à 12h

Lieu Vidéoconférence
Contact514 840-1234
Une présentation de Gilles Boulianne, chercheur sénior en traitement automatique de la parole au CRIM.

 

Tous les Événements

Liste des événements auxquels le CRIM et ses experts participent. Plusieurs rabais sont offerts à nos membres!

Voir les événements

Vous abonner aux infolettres du CRIM S'inscrire à notre infolettre

Voir nos infolettres récentes

Suivez-nous sur :   LinkedIn Flickr YouTube Medium