Séance de cours

Texte de manipulation : Récupération de documents, classification, analyse des sentiments

Description

Cette séance de cours porte sur le traitement des données textuelles, en mettant l'accent sur la recherche de documents, la classification et l'analyse des sentiments. Les sujets abordés comprennent l'utilisation de matrices TF-IDF, les méthodes de voisinage les plus proches et les défis de la capacité de modèle élevée. Il explore également l'utilisation de la factorisation matricielle pour la détection des sujets et le concept d'analyse sémantique latente. La séance de cours se penche sur l'importance de la régularisation dans les modèles d'apprentissage automatique et introduit le concept de modélisation probabiliste du sujet avec Latent Dirichlet Allocation (LDA). De plus, il traite de la transition des vecteurs de mots vers les vecteurs de mots contextualisés et du rôle des modèles comme le BERT dans les pipelines de traitement du langage naturel.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.