Cette séance de cours couvre les arbres de régression, en se concentrant sur la méthode CART et son application dans la prévision des prix des voitures d'occasion. L'instructeur explique le processus de sélection des seuils optimaux pour les prédicteurs, en soulignant l'importance de minimiser l'erreur quadratique moyenne (ESM) à chaque division. La séance de cours illustre comment construire un arbre de régression en utilisant un seul prédicteur et étend la discussion à plusieurs prédicteurs. L'instructeur souligne les risques de sur-ajustement et la nécessité d'utiliser la validation croisée pour déterminer quand arrêter de diviser l'arbre. En outre, la séance de cours présente des méthodes d'ensemble, y compris les forêts aléatoires et boosting, qui améliorent la précision de la prédiction en combinant plusieurs arbres. L'instructeur discute des avantages et des inconvénients de ces méthodes, en particulier leur interprétabilité et leur robustesse contre les surajustements. La session se termine par une étude de cas sur la prévision du rendement des actions, démontrant l'application pratique de ces concepts en finance, et met l'accent sur les défis des faibles ratios signal/bruit dans les données financières.