Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours porte sur diverses techniques d'analyse documentaire, en mettant l'accent sur la modélisation thématique à l'aide de mélanges de multinômes et de Latent Dirichlet Allocation (LDA). Il explique comment ces modèles génèrent de nouveaux documents et discute des modèles générateurs profonds, des autoencodeurs et de leur rôle en tant que modèles générateurs. La séance de cours présente également le concept de Variational Autoencoders (VAE) et de Generative Adversarial Networks (GANs) pour la production d'échantillons de données. En outre, il aborde les défis posés par les données hétérogènes et l'importance de la sélection des modèles et de la validation croisée dans l'apprentissage automatique.