Séance de cours

Représentations et traitement des données

Dans cours

CS-233(a): Introduction to machine learning (BA3)

Machine learning and data analysis are becoming increasingly central in many sciences and applications. In this course, fundamental principles and methods of machine learning will be introduced, analy

Description

Cette séance de cours couvre l'importance des représentations de données dans l'apprentissage automatique, en mettant l'accent sur des techniques telles que le sac de mots pour le texte et les dictionnaires visuels pour les images. Il aborde également les défis des données déséquilibrées et des stratégies de normalisation, de nettoyage et de prétraitement des données.

Enseignant

Mathieu Salzmann

I am a Senior Researcher at EPFL-CVLab, and, since May 2020, an Artificial Intelligence Engineer at ClearSpace (50%). Previously, I was a Senior Researcher and Research Leader in NICTA's computer vision research group. Prior to this, from Sept. 2010 to Jan 2012, I was a Research Assistant Professor at TTI-Chicago, and, from Feb. 2009 to Aug. 2010, a postdoctoral fellow at ICSI and EECS at UC Berkeley under the supervision of Prof. Trevor Darrell. I obtained my PhD in Jan. 2009 from EPFL under the supervision of Prof. Pascal Fua.

Source officielle

Séances de cours associées (31)

Représentations et traitement des données dans l'apprentissage automatique

Couvre les représentations de données et les techniques de traitement essentielles pour des algorithmes d'apprentissage automatique efficaces.

Data Wrangling avec Hive : gérer efficacement le Big Data

Couvre les techniques de querelles de données en utilisant Apache Hive pour une gestion efficace des big data.

Manipulation des données : modèles de données et embrouillement

Examine les éléments fondamentaux de la gestion des données, y compris les modèles, les sources et les querelles, en soulignant l'importance de comprendre et de résoudre les problèmes de données.

Représentations et traitement des données

Discute du surajustement, de la sélection des modèles, de la validation croisée, de la régularisation, des représentations de données et de la gestion des données déséquilibrées dans l'apprentissage automatique.

Questions relatives aux données dans le domaine de la recherche

Examine les défis que posent les hypothèses de données, les biais et d'autres aspects de la recherche, y compris les écritures incomplètes et les frustrations des nouveaux arrivants.

Afficher plus