Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre le concept de classification des documents, où un classificateur est construit pour attribuer des étiquettes à des documents non étiquetés basés sur des données de formation. Il explique l'utilisation de vecteurs de documents, de mots, d'expressions et de métadonnées en tant que caractéristiques dans des modèles de classification tels que k-Nearest-Neighbors, Naïve Bayes et word embeddings. Les défis liés à la gestion de la dimensionnalité élevée et à la mise en œuvre de modèles de classification sont également abordés, ainsi que les mécanismes d'auto-attention et les modèles de transformateurs.