Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre le concept de modèles thématiques, en se concentrant sur lallocation de Dirichlet latente (LDA). Il commence par une introduction aux tâches de clustering et à l'algorithme K-means, puis se penche sur l'estimation de la densité et les modèles de mélange gaussien. La séance de cours explique le processus d'apprentissage dans les MGM et les limites de l'estimation de la densité non paramétrique. Il explore en outre la distribution de Dirichlet et son rôle dans LDA, en discutant du processus génératif, de l'apprentissage et des méthodes approximatives d'inférence. La séance de cours se termine par une discussion sur l'évaluation des modèles LDA, son application dans les humanités numériques, et des extensions comme les modèles de sujets corrélés.