Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre les bases de la modélisation des sujets, en mettant l'accent sur l'allocation des dirichlets latents (ALD). Il explique le processus de regroupement des documents en sujets, d'estimation des distributions par mots-matières et d'insertion des distributions par thèmes-documents. La séance de cours traite également du processus générateur de LDA, des algorithmes d'apprentissage en cause et des limites du modèle. De plus, il explore l'utilisation de la LDA dans les humanités numériques, ses paramètres d'évaluation et son application comme forme de réduction de dimensionnalité. La séance de cours se termine par un aperçu des méthodes approximatives d'inférence et des extensions du modèle de LDA.