Les événements du CRIM

Le CRIM organise des événements qui traitent d’une variété de sujets à l’intention de la communauté des technologies de l’information du Québec. Ces rendez-vous, qui favorisent le réseautage et le maillage, abordent des thèmes d’actualité qui vous aideront à prendre les meilleures décisions pour la bonne gestion et le bon développement de vos projets TI.

LE SYSTÈME DE TRANSCRIPTION DE LA PAROLE ET DE DÉTECTION DE L'INDICATIF D'APPEL DU CRIM POUR LA COMPÉTITION ATC-AIRBUS

LE SYSTÈME DE TRANSCRIPTION DE LA PAROLE ET DE DÉTECTION DE L'INDICATIF D'APPEL DU CRIM POUR LA COMPÉTITION ATC-AIRBUS

 

LE SYSTÈME DE TRANSCRIPTION DE LA PAROLE ET DE DÉTECTION DE L'INDICATIF D'APPEL DU CRIM POUR LA COMPÉTITION ATC-AIRBUS

CONFÉRENCIERS

Lise Rebout, M. Sc., spécialiste en traitement automatique des langues naturelles au CRIM

Vishwa Gupta, Ph. D., chercheur sénior en traitement automatique de la parole au CRIM

RÉSUMÉ

La compétition organisée par Airbus portait sur le traitement automatique des conversations dans un contexte de contrôle du trafic aérien. La première tâche consistait à retranscrire des conversations réelles entre contrôleurs aériens et pilotes à l'aéroport de Toulouse en France. La deuxième était la détection des indicatifs d'appel (call sign) dans ces conversations. L'indicatif d'appel identifie le vol de façon unique et le pilote et le contrôleur aérien l'utilisent tous les deux.

Tous les enregistrements de la compétition étaient en anglais. La principale contribution du CRIM en modélisation acoustique pour la transcription de ces conversations fut l'expérimentation de modèles LSTM bidirectionnels (BLSTM) et de modèles TDNN entraînés par MMI sans treillis (LF-MMI TDNN). L’adaptation des modèles acoustiques entraînés sur un très grand ensemble de données aux 40 heures de données acoustiques fournies par Airbus entraîne une réduction significative du taux d'erreur de mots (WER) par rapport à des modèles acoustiques entraînés uniquement sur les données Airbus. Plusieurs itérations d'adaptation réduisent considérablement le WER pour les modèles acoustiques BLSTM, mais seulement marginalement pour les modèles acoustiques LF-MMI TDNN. Comme les conversations entre le contrôleur aérien et le pilote sont des dialogues très limités, la perplexité des modèles linguistiques s'avère très faible (moins de 12). Cette faible perplexité permet des taux d'erreurs de transcription raisonnables. Notre meilleur résultat est de 9,98 % sur les données de classement et de 9,41 % sur l'ensemble d'évaluation.

Nous avons effectué la détection des indicatifs d'appel à partir de la transcription de l'audio. Nous utilisons une architecture constituée de deux LSTM bidirectionnels suivis d'un classificateur à champ aléatoire conditionnel (CRF) pour étiqueter les indicatifs d'appel. Les résultats obtenus ainsi surpassent ceux obtenus à l'aide d'un  transducteur à états finis. Combiner les indicatifs d'appel détectés à partir de plusieurs décodages (vote par majorité) nous a permis de diminuer notre taux d’erreur. Nous avons également effectué une étape de post-traitement basée sur des patrons pour augmenter notre rappel. Notre meilleur score F1 pour la détection de l'indicatif d'appel s'élève à 0.8289 sur les données de classement et à 0.8017 sur les données d'évaluation. Dans l'ensemble, nous nous sommes classés troisièmes dans cette compétition.


Les séminaires scientifiques du CRIM, gratuits et ouverts à tous, sont donnés par des experts de renommée internationale, des collaborateurs universitaires, le personnel de R-D et les boursiers du CRIM. Au programme, des présentations conviviales sur les dernières avancées scientifiques et technologiques. 

Présentation en français et en anglais. Conférence gratuite. Inscription requise.

Le 30 novembre 2018
De 11h à 12h

Lieu CRIM405, avenue Ogilvy, Bureau 101Montréal, H3N 1M3
Contact514 840-1234
Les séminaires scientifiques du CRIM, gratuits et ouverts à tous, sont donnés par des experts de renommée internationale, des collaborateurs universitaires, le personnel de R-D et les boursiers du CRIM. Au programme, des présentations conviviales sur les dernières avancées scientifiques et technologiques.

Tous les Événements

Liste des événements auxquels le CRIM et ses experts participent. Plusieurs rabais sont offerts à nos membres!

Voir les événements

Vous abonner aux infolettres du CRIM S'inscrire à notre infolettre

Voir nos infolettres récentes

Suivez-nous sur :   LinkedIn Flickr YouTube Medium