Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre le processus de recherche de représentations numériques pour les mots à l'aide de la factorisation matricielle, en se concentrant sur les données textuelles. Il explique l'importance de capturer la sémantique des mots et de construire de bonnes représentations de caractéristiques, au profit de diverses applications d'apprentissage automatique. La séance de cours s'inscrit également dans la matrice de co-occurrence, qui représente les associations de mots dans un corpus de texte, et le modèle GloVe, une variante de word2vec. De plus, il traite du modèle Skip-Gram pour l'apprentissage des représentations de mots et des techniques de formation impliquées dans le processus.