Séance de cours

Modèles d'intégration de mots : Optimisation et applications

Dans cours

This course introduces the foundations of information retrieval, data mining and knowledge bases, which constitute the foundations of today's Web-based distributed information systems.

Description

Cette séance de cours s'inscrit dans le processus d'optimisation des modèles d'intégration de mots, en mettant l'accent sur la maximisation des probabilités globales et des paramètres d'apprentissage à partir d'exemples positifs et négatifs. Il couvre le modèle de skipgram avec un échantillonnage négatif, une minimisation de la fonction de perte et une descente en gradient pour l'apprentissage. L'instructeur explique la dérivation des probabilités, le softmax hiérarchique et des techniques comme Fasttext, Byte Pair Encoding et Subword Embeddings pour améliorer l'efficacité du modèle. La séance de cours se termine par une explication détaillée de l'algorithme BPE et de son application dans le tokenisation du texte.

Enseignant

Karl Aberer

Co-Founder of LinkAlong Sarl, 2017.Vice-president EPFL for Information Systems, 2012 –2016.Director of the Swiss National Centre for Mobile Information and Communication Systems NCCR MICS (mics.ch), 2005 -2012.Member of the Swiss Research and Technology Council SWTR, consulting the Swiss Federal government, 2004 - 2011.

Source officielle

Séances de cours associées (28)

Incorporation de mots : contexte et représentation

Explore l'intégration des mots, en mettant l'accent sur les relations mot-contexte et les représentations de faible dimension.

Optimisation de l'apprentissage automatique

Explore les techniques d'optimisation, l'intégration de mots et les systèmes de recommandation dans l'apprentissage automatique.

L'adhésion des mots : modèles et apprentissage

Explore l'intégration de mots, l'importance du contexte et les algorithmes d'apprentissage pour créer de nouvelles représentations.

Word Embeddings: Modélisation du contexte et de la similarité des mots

Couvre les encastrements de mots, la modélisation du contexte des mots et la similitude dans un espace de faible dimension.

Théorie de la probabilité : Solutions à moyen terme

Couvre les solutions à l'examen à mi-parcours d'un cours de théorie des probabilités, y compris le calcul des probabilités et des attentes.

Afficher plus