Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
L’apprentissage actif est un modèle d’apprentissage semi-supervisé où un oracle intervient au cours du processus. Plus précisément, contrairement au cadre classique où les données sont connues et imposées, en apprentissage actif, c'est l'algorithme d'apprentissage qui demande des informations pour des données précises. Cette technique repose sur l'hypothèse que l’acquisition de données non étiquetées est beaucoup moins coûteuse que celle de données étiquetées. Elle repose également sur l’hypothèse que l’apprentissage est plus efficace lorsque l’on est curieux, en cherchant les données les plus intéressantes à étiqueter. L’apprentissage actif permet d'effectuer diverses tâches classiques dans le domaine de l'apprentissage automatique telles que la classification ou la régression. Le principe de la technique est de trouver la requête la plus pertinente pendant le processus d’apprentissage afin de maximiser le gain d’informations sur le problème. C’est pour cela que ce type d’apprentissage nécessite des interactions avec un oracle (humain ou non). Contrairement à l’apprentissage passif, c’est l'apprenant (learner) qui choisit les données à étiqueter par l’oracle. À cette fin, il existe plusieurs types de processus de construction ou de sélection de ces requêtes, qui sont détaillés dans les sections suivantes. Par exemple, disons que l'on peut disposer d'un expert, un cancérologue de grande renommée (l'oracle), et donc très cher lorsque l'on souhaite identifier si sur une radiographie il y a ou non présence de tumeur cancéreuse (classification binaire : il y a une tumeur, ou non). Dans cet exemple, la création d'une base de données non étiquetées, un ensemble de radiographies, est beaucoup moins coûteuse que d’acquérir un ensemble de données étiquetées, via le diagnostic d'un expert sur chaque donnée. L'apprenant va donc réfléchir aux questions les plus intéressantes à poser, c'est-à-dire sur les cas les plus ambigus, afin de maximiser son savoir sur ces radiographies tout en minimisant le coût (les honoraires du médecin).
Devis Tuia, Benjamin Alexander Kellenberger, Marc Conrad Russwurm
David Atienza Alonso, Marina Zapater Sancho, Luis Maria Costero Valero, Darong Huang, Ali Pahlevan