Concept

Topic model

Séances de cours associées (25)

Modèles du sujet: Allocation de dirichlet latent

Présente l'attribution des dirichlets latents pour la modélisation des sujets dans les documents, en discutant de son processus, de ses demandes et de ses limites.

Modèles du sujet: Comprendre les structures latentes

Explore les modèles thématiques, les modèles de mélange gaussien, la répartition des dirichlets latents et l'inférence variationnelle dans la compréhension des structures latentes à l'intérieur des données.

Modèles thématiques

Introduit des modèles thématiques, couvrant le clustering, le GMM, le LDA, la distribution de Dirichlet et l'inférence variationnelle.

Modèles du sujet: Allocation de dirichlet latent

Couvre des modèles thématiques, en se concentrant sur l'allocation de Dirichlet latente, le regroupement, les MGM, la distribution de Dirichlet, l'apprentissage LDA et les applications en humanités numériques.

Modèles de sujets probabilistes : Latent Dirichlet Allocation

Explore Latent Dirichlet Allocation, un modèle de sujet probabiliste pour le regroupement et l'analyse de documents à l'aide de distributions sur des mots et des sujets.

Réseaux bayésiens : principes fondamentaux et applications

Couvre les fondamentaux des réseaux bayésiens et leurs applications dans la modélisation probabiliste de sujets.

Traitement des langues naturelles

Introduit le traitement du langage naturel, qui couvre le prétraitement du texte, l'analyse des sentiments et l'analyse des sujets, en mettant l'accent sur l'établissement d'un indice de risque pour le changement climatique.

Analyse des documents : Modélisation des sujets

Explore l'analyse documentaire, la modélisation thématique et les modèles génériques pour la production de données dans l'apprentissage automatique.

Texte de manipulation : Récupération de documents, classification, analyse des sentiments

Explore la recherche de documents, la classification, l'analyse des sentiments, les matrices TF-IDF, les méthodes de voisinage les plus proches, la factorisation matricielle, la régularisation, LDA, les vecteurs de mots contextualisés et BERT.

Attribution de Dirichlet latent

Couvre l'allocation de Dirichlet latente, une méthode de pointe pour l'extraction de concepts à l'aide d'un modèle génératif probabiliste.

Incorporer des modèles : concepts et récupération

Couvre les modèles d'intégration pour la récupération de documents, l'indexation sémantique latente, le SVD et les modèles thématiques.

Traitement de texte : Analyse de grandes collections de texte numérique

Plongez dans le traitement de grandes collections de textes numériques, en explorant les régularités cachées, la réutilisation du texte et l'analyse TF-IDF.

Recherche et classification de documents

Couvre la récupération de documents, la classification, l'analyse des sentiments et la détection de sujets à l'aide de matrices TF-IDF et de vecteurs de mots contextualisés tels que BERT.

Analyse de documents et modélisation de sujets

Couvre l'analyse documentaire, la modélisation thématique et les modèles génératifs profonds, y compris les auto-encodeurs et les GAN.

Indexation sémantique latente : concepts et applications

Explore l'indexation sémantique latente, une technique de cartographie des documents dans un espace conceptuel pour la recherche et la classification.

Traitement de texte: Matrice, Documents, Sujets

Explore la gestion du texte, en se concentrant sur les matrices, les documents et les sujets, y compris les défis de la classification des documents et des modèles avancés comme BERT.

Sémantique spatiale vectorielle (et récupération d'information)

Explore le modèle Vector Space, le sac de mots, tf-idf, cosine similarité, Okapi BM25, et la précision et le rappel dans la récupération d'information.

Modèles de génération profonde

Couvre les modèles génératifs profonds, y compris les auto-encodeurs variationnels, les GAN et les GAN convolutifs profonds.

Modèles de texte: Word Embeddings et modèles de sujet

Explore les intégrations de mots, les modèles de sujet, Word2vec, les réseaux bayésiens et les méthodes d'inférence telles que l'échantillonnage Gibbs.

Préparation du débat : Logistique et stratégies

Couvre la logistique et les stratégies pour les prochains débats, y compris la structuration des arguments et l'anticipation des contre-arguments.