Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre les fondamentaux des arbres de décision, en mettant l'accent sur la régression et la classification. Il explique le processus de construction des arbres, la sélection des caractéristiques et la détermination des seuils. L'instructeur discute des critères utilisés pour l'induction des arbres de décision, comme la perte carrée moyenne pour les arbres de régression et l'impureté de Gini pour les arbres de classification. De plus, la séance de cours souligne les caractéristiques de l'induction des arbres de décision, y compris l'interprétation, la préparation minimale des données et la sélection automatique des caractéristiques. Il s'attaque également aux défis de la suradéquation et des performances sous-optimales, fournissant des informations sur les techniques d'élagage pour éviter une grande profondeur d'arbre. Différents exemples sont présentés pour illustrer les concepts.