Séance de cours

Récupération d'information: espace vectoriel

Dans cours

This course introduces the foundations of information retrieval, data mining and knowledge bases, which constitute the foundations of today's Web-based distributed information systems.

Description

Cette séance de cours couvre les bases de la récupération d'informations, en se concentrant sur les modèles d'espace vectoriel. Les sujets abordés incluent le calcul de similarité, la similarité cosinus, les fréquences des termes, les fichiers inversés et l'algorithme de Fagin. Les exercices pratiques comprennent la mise en œuvre de la rétroaction sur la pertinence et la numérisation parallèle des listes de diffusion.

Enseignant

Karl Aberer

Co-Founder of LinkAlong Sarl, 2017.Vice-president EPFL for Information Systems, 2012 –2016.Director of the Swiss National Centre for Mobile Information and Communication Systems NCCR MICS (mics.ch), 2005 -2012.Member of the Swiss Research and Technology Council SWTR, consulting the Swiss Federal government, 2004 - 2011.

Source officielle

Proximité ontologique

Information engineering

Traitement automatique du langage naturel: Traitement automatique du langage naturel

Séances de cours associées (32)

Données de base sur la récupération de l'information

Introduit les bases de la recherche de l'information, couvrant la recherche par texte et booléen, la recherche de l'espace vectoriel et le calcul de la similitude.

Données de base sur la récupération de l'information

Présente les bases de la récupération d'informations, couvrant la représentation de documents, l'expansion des requêtes et TF-IDF pour le classement des documents.

Bases de récupération d'information: modèles d'espace booléen et vectoriel

Introduit des modèles Booléen et Vector Space pour la recherche d'informations, couvrant la syntaxe, le calcul de similarité, la fréquence des termes et les poids des requêtes.

Récupération probabiliste

Couvre la récupération d'informations probabilistes, la pertinence de la modélisation en tant que probabilité, l'expansion des requêtes et la génération automatique de thésaurus.

Recherche d'informations : Fagin's Algorithm

Couvre la mise en œuvre de l'algorithme de Fagin pour la récupération d'informations, en mettant l'accent sur la récupération efficace de documents.

Afficher plus