Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours s'inscrit dans le processus d'optimisation des modèles d'intégration de mots, en mettant l'accent sur la maximisation des probabilités globales et des paramètres d'apprentissage à partir d'exemples positifs et négatifs. Il couvre le modèle de skipgram avec un échantillonnage négatif, une minimisation de la fonction de perte et une descente en gradient pour l'apprentissage. L'instructeur explique la dérivation des probabilités, le softmax hiérarchique et des techniques comme Fasttext, Byte Pair Encoding et Subword Embeddings pour améliorer l'efficacité du modèle. La séance de cours se termine par une explication détaillée de l'algorithme BPE et de son application dans le tokenisation du texte.