Cette séance de cours introduit le concept de réduction de dimensionnalité, en mettant l'accent sur les défis posés par les représentations de données à haute dimension dans les applications d'apprentissage automatique telles que le traitement de l'image et la génomique. L'instructeur explique la nécessité de réduire le nombre de variables pour améliorer le rendement du modèle, en discutant de méthodes comme l'analyse des composantes principales (APC) pour obtenir des représentations de données plus compactes et plus robustes. La malédiction de la dimensionnalité est explorée, soulignant comment les espaces à haute dimension conduisent à la sparté des données et à l'augmentation des coûts de calcul. Les implications pratiques de la réduction de dimensionnalité, y compris l'amélioration de la qualité des modèles et l'évitement du surajustement, sont également discutées.
Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.
Regarder sur Mediaspace