Les événements du CRIM

Le CRIM organise des événements qui traitent d’une variété de sujets à l’intention de la communauté des technologies de l’information du Québec. Ces rendez-vous, qui favorisent le réseautage et le maillage, abordent des thèmes d’actualité qui vous aideront à prendre les meilleures décisions pour la bonne gestion et le bon développement de vos projets TI.

Automated speech-to-text transcription of Indigenous Languages

Automated speech-to-text transcription of Indigenous Languages

Présentation en anglais

Transcription automatisée de la parole au texte des langues autochtones

CONFÉRENCIERS

Gilles Boulianne et Vishwa Gupta, chercheurs séniors en traitement automatique de la parole au CRIM.


Automated speech-to-text transcription of Indigenous Languages

SPEAKERS

Gilles Boulianne and Vishwa Gupta, Senior Researchers in Automatic Speech Processing, CRIM.

ABSTRACT

This presentation will outline the progress CRIM has made in automated transcription of audio from Indigenous languages. Automated transcription of Indigenous languages is part of the audio segmentation and indexation project launched by NRC (Indigenous Language Revitalization Using Digital Technology). In this presentation we show the progress we have made in automatically transcribing Inuktitut and Cree. We will also outline methods and tools CRIM has made available for researchers and communities involved in language documentation and preservation.

Many Indigenous languages are polysynthetic. For example, Inuktitut is highly polysynthetic, like many of the 900 Indigenous languages spoken in the Americas. In addition, Inuktitut is a low resource language. The only data available are texts from Nunavut parliament proceedings, plus 23 hours of transcribed oral stories. Using this corpus, we can show that Inuktitut displays a much higher degree of polysynthesis than other agglutinative languages usually considered in ASR, such as Finnish or Turkish.  Even with a vocabulary of 1.3 million words derived from Nunavut parliament proceedings and stories, held-out stories still contain more than 60% out-of-vocabulary words. Therefore, our solution was to train bi-directional LSTM acoustic models, then investigate word and subword units, morphemes and syllables, as well as a deep neural network that finds word boundaries in subword sequences.  We will show that acoustic decoding using syllables with word boundary markers results in the lowest word error rate.


Les séminaires scientifiques du CRIM, gratuits et ouverts à tous, sont donnés par des experts de renommée internationale, des collaborateurs universitaires, le personnel de R-D et les étudiants du CRIM. Au programme, des présentations conviviales sur les dernières avancées scientifiques et technologiques.


Conférence gratuite. Inscription requise.

Le 28 février 2020
De 11h à 12h

Lieu CRIM405, avenue Ogilvy,
Bureau 101, Salle 1056
Montréal, H3N 1M3
ContactCRIM514 840-1234
Une présentation de Gilles Boulianne et Vishwa Gupta, chercheurs séniors en traitement automatique de la parole au CRIM.
S'inscrire

Tous les Événements

Liste des événements auxquels le CRIM et ses experts participent. Plusieurs rabais sont offerts à nos membres!

Voir les événements

Vous abonner aux infolettres du CRIM S'inscrire à notre infolettre

Voir nos infolettres récentes

Suivez-nous sur :   LinkedIn Flickr YouTube Medium