Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre les concepts d'ensemblage, d'ensachage et de forêts aléatoires, en se concentrant sur la réduction de la variance, les échantillons OOB, l'importance variable et les détails de l'algorithme. Il explique comment l'ensachage fonctionne pour la perte carrée et ses limites avec différents prédicteurs. L'instructeur discute également de l'idée clé derrière les forêts aléatoires, qui visent à réduire davantage les corrélations en randomisant la construction d'arbres. En outre, la séance de cours explore le concept de la validation croisée hors du sac et diverses mesures d'importance variable dans les forêts aléatoires, telles que le score de Gini VI et le score de permutation VI.