Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre les concepts de sur-ajustement vs sous-ajustement, la sélection du modèle en utilisant la validation croisée, LOOCV, k-fold validation croisée, et limportance de pénaliser le sur-ajustement dans les modèles dapprentissage automatique. Il explore également la régression linéaire régularisée, la régression des crêtes du noyau et l'importance de trouver la force de régularisation appropriée. La séance de cours explore en outre le besoin de représentations de données, les défis de l’hétérogénéité, de la taille et du bruit des données, et des techniques telles que Bag of Words pour les données textuelles et les dictionnaires visuels pour les données d’images. Il se termine par des discussions sur le prétraitement des données, la gestion des données déséquilibrées, la repondération des échantillons et la transition des représentations artisanales aux représentations apprises.