Séance de cours

Classification des documents

Description

Cette séance de cours couvre la tâche de classification des documents, où un classificateur est construit pour attribuer des étiquettes à des documents non étiquetés basés sur un ensemble de formation. Les sujets incluent des caractéristiques de document comme un sac de mots, des phrases et des fragments de mots, traitant de la dimensionnalité élevée, des algorithmes de classification comme k-Nearest-Neighbors et Naïve Bayes, et l'utilisation de mots incorporés pour la classification. L'instructeur discute également des défis de la classification des documents, tels que la taille du vocabulaire et la sélection des fonctionnalités. Différentes méthodes de classification et leurs caractéristiques sont explorées, dont le classificateur Naïve Bayes et Fasttext. La séance de cours se termine par un résumé des méthodes de classification des documents et de leurs applications.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.