Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre l'analyse de documents et la modélisation de sujets, en mettant l'accent sur la découverte de thèmes récurrents dans les documents texte et la relation entre les documents et les sujets. Il introduit un mélange de modèles multinoullis et d'allocation de Dirichlet latente (LDA) comme méthodes pour affecter des sujets à des documents. Les limites des modèles de mélange sont discutées, ce qui conduit à lintroduction de LDA, qui permet à chaque mot dans un document davoir son propre sujet. L'inférence variationnelle et les auto-encodeurs variationnels sont présentés comme des techniques pour estimer les paramètres du modèle et apprendre des représentations latentes significatives. La séance de cours se termine par un aperçu des modèles génératifs profonds, y compris les auto-encodeurs, les réseaux antagonistes génératifs (GAN) et les GAN conditionnels.