Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours de l'instructeur se concentre sur la reconnaissance visuelle profonde et l'interprétabilité. Il couvre la révolution d'apprentissage profond, la segmentation sémantique et la reconstruction déformable en 3D. La séance de cours explore l'utilisation des modèles Bag of Words et Bag of Visual Words, des architectures CNN standard et la création de dictionnaires visuels. Il se transforme en expériences avec des ensembles de données, des mots de code visuels et la détection d'attaques adverses. L'instructeur discute également des scènes complexes, proposant des solutions pour l'encodage des fonctionnalités locales et générant des cartes d'attention. La séance de cours se termine par des réflexions sur la reconnaissance de la scène, la mise en commun de l'attention et de l'importance de l'interprétation dans les réseaux profonds.