Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours traite des concepts de généralisation et d'ajustement excessif dans les modèles d'apprentissage automatique. La généralisation fait référence à la capacité dun modèle à faire des prédictions précises sur de nouvelles données invisibles. Le surajustement se produit lorsqu'un modèle est trop complexe et capture le bruit dans les données d'entraînement, ce qui entraîne de mauvaises performances sur les nouvelles données. Le sous-ajustement, dautre part, se produit lorsquun modèle est trop simple et ne parvient pas à capturer les modèles sous-jacents dans les données. La séance de cours illustre ces concepts avec des exemples de modèles de complexité variable et le compromis entre le nombre de paramètres et la quantité de données de formation. Il couvre également différentes fonctions de perte pour lévaluation des modèles et limportance de considérer les valeurs aberrantes dans les données. L’objectif est de trouver un équilibre entre la complexité du modèle et la disponibilité des données pour atteindre des performances optimales.