Séance de cours

Analyse des données textuelles : Techniques et applications

Séances de cours associées (32)

Indexation sémantique latente : concepts et applications

Explore l'indexation sémantique latente, la construction de vocabulaire, la création de matrices de documents, la transformation de requêtes et la récupération de documents en utilisant la similarité cosinus.

Graph Mining : Réseaux sociaux et analyse de données

Explore l'exploration de graphes dans les réseaux sociaux, couvrant l'analyse de données et la détection de communauté.

Récupération probabiliste

Couvre la récupération d'informations probabilistes, la pertinence de la modélisation en tant que probabilité, l'expansion des requêtes et la génération automatique de thésaurus.

Indexation sémantique latente : fichiers inversés

Explore les indices de décalage terminologique dans les fichiers inversés et les solutions de rétroaction de pertinence.

Attribution de Dirichlet latent

Couvre l'allocation de Dirichlet latente, une méthode de pointe pour l'extraction de concepts à l'aide d'un modèle génératif probabiliste.

Exercice de récupération d'espace vectoriel

Couvre le calcul TF-IDF, les vecteurs de documents, la similarité cosinus et les formules de précision.

Récupérer l'information : bases et techniques

Introduit les bases de la récupération d'informations, couvrant l'indexation, les schémas de pondération, la similarité cosinus et l'évaluation des requêtes.

Indexation sémantique latente

Couvre l'indexation sémantique latente, une méthode pour améliorer la récupération d'informations en cartographiant des documents et des requêtes dans un espace conceptuel de dimension inférieure.

Apprentissage non supervisé : réduction de la dimensionnalité et regroupement

Couvre l'apprentissage non supervisé, en mettant l'accent sur la réduction de la dimensionnalité et le regroupement, en expliquant comment il aide à trouver des modèles dans les données sans étiquettes.

Bases de récupération d'information: modèles d'espace booléen et vectoriel

Introduit des modèles Booléen et Vector Space pour la recherche d'informations, couvrant la syntaxe, le calcul de similarité, la fréquence des termes et les poids des requêtes.

Réseaux neuronaux : formation et activation

Explore les réseaux neuronaux, les fonctions d'activation, la rétropropagation et l'implémentation de PyTorch.

Introduction à l'analyse des données appliquées

Introduit le cours d'analyse des données appliquées à l'EPFL, couvrant un large éventail de sujets d'analyse des données et mettant l'accent sur l'apprentissage continu en sciences des données.