Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre le concept des arbres de décision, en commençant par les bases de la construction et de l'induction des arbres, y compris le processus de sélection des attributs et des nœuds de division. Il explore ensuite les défis de la gestion des attributs continus, en discutant des arbres de décision binaires et des problèmes d'évolutivité liés aux divisions d'attributs continues. L'instructeur explique l'importance des stratégies d'élagage pour éviter les surajustements et introduit le principe de la longueur minimale de description. La séance de cours se termine par une discussion sur l'extraction des règles de classification des arbres, mettant l'accent sur l'interprétabilité et la force de sélection automatique des caractéristiques des arbres de décision, tout en soulignant leur sensibilité aux perturbations des données et leur tendance au surajustement.