Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours porte sur les méthodes de classification des documents, en commençant par la tâche de construire un classificateur pour attribuer des étiquettes aux documents non étiquetés. Il explore des caractéristiques comme un sac de mots, des phrases et des caractéristiques grammaticales, ainsi que des défis dans le traitement des espaces de caractéristiques haute dimension. Différents algorithmes de classification tels que k-Nearest-Neighbors et Naïve Bayes Classifier sont discutés, ainsi que leurs estimations probabilistes. La séance de cours se transforme également en modèles de transformateur, en mécanismes d'auto-attention et en l'utilisation de l'attention multi-têtes pour apprendre différentes relations. L'importance de l'intégration des positions, de la normalisation des couches et des perceptrons multicouches dans les réseaux de transformateurs est soulignée, ainsi que le processus de combinaison des sorties d'attention multicouches. La séance de cours se termine par des réflexions sur le réglage fin des réseaux de transformateurs et sur l'importance des modèles de transformateurs dans la classification des documents.