Séance de cours

Pipeline de classification : construction et évaluation

Dans cours

This course introduces the foundations of information retrieval, data mining and knowledge bases, which constitute the foundations of today's Web-based distributed information systems.

Description

Cette séance de cours couvre le processus de construction et d'évaluation d'un pipeline de classification en utilisant des ensembles de données de tweet avec des sentiments étiquetés. Il explique comment agréger les annotations, créer des fonctionnalités avec la technique du sac de mots, construire un pipeline avec scikit-learn, évaluer les classificateurs à l'aide de mesures de précision, de rappel, de F1 et de confusion, et interpréter le classificateur à l'aide d'arbres de décision et de l'importance des fonctionnalités. L'instructeur souligne l'importance d'affiner les paramètres en utilisant la validation croisée pour atteindre des performances optimales.

Enseignant

Karl Aberer

Co-Founder of LinkAlong Sarl, 2017.Vice-president EPFL for Information Systems, 2012 –2016.Director of the Swiss National Centre for Mobile Information and Communication Systems NCCR MICS (mics.ch), 2005 -2012.Member of the Swiss Research and Technology Council SWTR, consulting the Swiss Federal government, 2004 - 2011.

Source officielle

Séances de cours associées (32)

Arbres de décision: Classification

Explore les arbres de décision pour la classification, l'entropie, le gain d'information, l'encodage à chaud, l'optimisation de l'hyperparamètre et les forêts aléatoires.

Évaluation du modèle: K-Nearest Neighbor

Explore l'évaluation des modèles avec K-Nearest Neighbor, couvrant la sélection optimale de k, les mesures de similarité et les mesures de performance pour les modèles de classification.

Arbres de décision et forêts aléatoires: concepts et applications

Discute des arbres de décision et des forêts aléatoires, en se concentrant sur leur structure, leur optimisation et leur application dans les tâches de régression et de classification.

Apprentissage supervisé: Méthodes de régression

Explore l'apprentissage supervisé en mettant l'accent sur les méthodes de régression, y compris l'ajustement des modèles, la régularisation, la sélection des modèles et l'évaluation du rendement.

Bases de l'apprentissage automatique

Introduit les bases de l'apprentissage automatique, y compris la collecte de données, l'évaluation des modèles et la normalisation des fonctionnalités.

Afficher plus