Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours porte sur l'importance de la représentation et du traitement des données dans l'apprentissage automatique, en mettant l'accent sur des sujets tels que le surajustement, la sélection des modèles, les méthodes de validation croisée, la pénalisation du surajustement, la régression linéaire régularisée, la régression des crêtes du noyau et la recherche de la bonne force de régularisation. Il s'inscrit également dans les concepts de sac de mots, de dictionnaires visuels, d'histogrammes et de techniques de normalisation des données. La séance de cours met l'accent sur les défis posés par les données déséquilibrées et explore des solutions telles que les méthodes d'échantillonnage, la repondération des échantillons et la transition des représentations artisanales aux représentations apprises.