Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre les principes fondamentaux de l'apprentissage profond pour le traitement du langage naturel (NLP), y compris l'incorporation de mots neuraux, les réseaux neuraux récurrents pour la modélisation des séquences et la modélisation névralgique attenante avec les transformateurs. L'instructeur discute des défis des fenêtres de contexte fixes dans les premiers modèles de langage neuronal, des limites des modèles récurrents dans l'apprentissage des dépendances à longue distance, et des progrès apportés par les mécanismes d'auto-attention dans les transformateurs. La présentation comprend une explication détaillée de l'auto-attention, l'attention multi-têtes, et l'architecture d'un modèle de transformateur complet avec des blocs encodeur et décodeur.
Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.
Regarder sur Mediaspace