Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours explore le concept de généralisation dans l'apprentissage automatique, en se concentrant sur le compromis entre les données sous-adaptées et suradaptées. L'instructeur explique le cadre enseignant-étudiant, les limites du pire cas et du cas typique, et l'évaluation de l'erreur de généralisation. La séance de cours présente le modèle multiple et discute de la relation entre lerreur de généralisation et le nombre déchantillons dans les modèles de données de grande dimension. Il explore l'utilisation de caractéristiques aléatoires et de projections orthogonales dans les tâches d'apprentissage automatique, en soulignant leur impact sur l'erreur de généralisation. La présentation couvre également le phénomène de double descente, où lerreur de généralisation diminue après un seuil dinterpolation, et limportance de la régularisation dans le contrôle de la complexité du modèle.