Les événements du CRIM

Les Séminaires R-D sont des rendez-vous scientifiques sur les dernières avancées scientifiques et technologiques.
Les Journées Technos sont des rendez-vous où le monde de la recherche et le monde industriel se rencontrent pour échanger sur des thématiques émergentes.

Inférence de modèles optimaux

Inférence de modèles optimaux

Présentation en français

Inférence de modèles optimaux

Conférencier

Florent Avellaneda, Ph. D., chercheur en modélisation, test et vérification logiciel, CRIM

Résumé

L'apprentissage automatique, qui consiste à inférer des modèles à partir d'observations, est un domaine de recherche très actif qui a conduit à d'importantes avancées dans de nombreux domaines. Parmi les méthodes récentes, l'apprentissage automatique est sans doute la méthode qui suscite le plus d'intérêt. Cette méthode, basée sur une descente de gradient, consiste à corriger itérativement un réseau de neurones afin de minimiser ses erreurs de classifications sur un jeu de donnée d'apprentissage. Un défaut récurant de cette méthode (et de nombreuses autres méthodes en apprentissage automatique), est le possible surentrainement des modèles, c.-à-d. inférer des modèles qui auront tendance à reconnaitre seulement les jeux de données d'apprentissage sans généraliser aux cas généraux. Pour contourner ce problème, des volumes importants de donnée doivent être disponibles et de nombreuses techniques telles que l'augmentation de données ont été utilisées avec plus ou moins de succès. 

Dans cette présentation, nous nous intéresserons à l'inférence de modèles optimaux. Nous définirons l'optimalité d'un modèle en nous basant sur le théorème de Bayes et la théorie de l'information et proposerons des méthodes permettant d'inférer de tels modèles dans le cas de systèmes déterministes. Nous nous intéresserons spécifiquement à l'inférence d'automates ainsi qu'à l'inférence d'arbres de décisions. Nous mettrons en évidence le constat que contrairement à la majorité des méthodes d'apprentissage automatique, l'inférence de modèles optimaux ne souffre pas du problème de surapprentissage. Au contraire, l'objectif est d'obtenir un modèle qui représente de manière optimale le jeu des données d’apprentissage. De plus, nous observerons que la quantité minimale de données requises pour obtenir un modèle qualité est considérablement réduite en inférant des modèles optimaux.

Biographie

Florent Avellaneda a joint l’équipe du CRIM en novembre 2015 à titre de  postdoctorant. Titulaire d’une maîtrise et d’un doctorat en informatique fondamentale de l’Université d’Aix-Marseille (France), Florent a travaillé comme chercheur postdoctorant au LAAS-CNRS et à l’IRIT de Toulouse dans le cadre d’un projet avec la fondation STAE dans le domaine des méthodes formelles. Ses principaux domaines d'intérêt sont l'inférence de modèles, la programmation par contraintes, la modélisation et la vérification formelle.


Inferring Optimal Models

Speaker

Florent Avellaneda, Ph.D., Researcher in Software Modeling, Testing and Verification, CRIM

Abstract

Machine learning, which consists in inferring models from observations, is a very active field of research that has led to important advances in many areas. Among the recent methods, machine learning is undoubtedly the one attracting the most interest. This method, based on a gradient descent, consists in iteratively correcting a neural network to minimize its classification errors on a set of learning data. A recurring flaw of this method (and of many other methods in machine learning), is the possible over-training of models, i.e., inferring models that will tend to recognize only data sets of the learning phase, without generalizing to general cases. To get around this problem, large data volumes must be available and many techniques such as data augmentation have been proposed with varying degrees of success.

In this presentation, we will focus on the inference of optimal models. We will define the optimality of a model based on Bayes' theorem and information theory and will propose methods to infer such models in the case of deterministic systems. We are specifically interested in automaton inference and decision tree inference. We will demonstrate that, contrary to the majority of machine learning methods, the inference of optimal models does not suffer from the problem of overlearning. On the contrary, the objective is to obtain a model that optimally represents the training data set. Moreover, we will observe that the minimum amount of data required to obtain a quality model is considerably reduced when inferring optimal models. 

Biography

Florent Avellaneda joined CRIM in November 2015 as a postdoctoral. He holds a master’s degree in fundamental computer science from Université Aix-Marseille (France). Florent has worked with LASS-CNRS and Toulouse’s IRIT on a project with the STAE foundation in the area of formal modelling. His main areas of interest include model inference, constraint programming, modeling and formal verification.


Les séminaires scientifiques du CRIM, gratuits et ouverts à tous, sont donnés par des experts de renommée internationale, des collaborateurs universitaires, le personnel de R-D et les étudiants du CRIM. Au programme, des présentations conviviales sur les dernières avancées scientifiques et technologiques.


Conférence virtuelle. Gratuit, inscription obligatoire.

En vidéoconférence : l'hyperlien sera envoyé quelques jours avant la conférence.

Le 11 déc. 2020
De 11h à 12h

Une présentation de Florent Avellaneda, chercheur en modélisation, test et vérification logiciel au CRIM.
Vous abonner aux infolettres du CRIM S'inscrire à notre infolettre
Suivez-nous sur :   LinkedIn  YouTube Medium