Cette séance de cours se concentre sur le concept de surajustement dans l'apprentissage supervisé, en particulier à travers le prisme de la régression polynomiale. Il commence par une étude de cas qui suppose un vrai modèle représenté par un polynôme de 10ème ordre, où le bruit est introduit. L'instructeur démontre comment adapter les polynômes de 2e et de 10e ordre à un ensemble de données limité à 15 points peut conduire à des résultats inattendus, soulignant qu'un modèle plus complexe ne donne pas toujours de meilleures performances hors échantillon. La discussion sétend aux techniques de sélection de modèles, y compris les méthodes de sélection et de régularisation des sous-ensembles, qui visent à équilibrer la complexité du modèle et la précision prédictive. La séance de cours couvre également les mesures de performance telles que R2, lerreur carrée moyenne et les méthodes de validation croisée, soulignant leur importance dans lévaluation de lefficacité du modèle. Enfin, l'instructeur présente des applications pratiques, y compris des études de cas sur la prévision des prix des voitures d'occasion, illustrant comment différents modèles peuvent être évalués et sélectionnés en fonction de leurs capacités prédictives.