Séance de cours

Représentations et traitement des données

Description

Cette séance de cours couvre les concepts de sur-ajustement vs sous-ajustement, la sélection du modèle en utilisant la validation croisée, LOOCV, k-fold validation croisée, et limportance de pénaliser le sur-ajustement dans les modèles dapprentissage automatique. Il explore également la régression linéaire régularisée, la régression des crêtes du noyau et l'importance de trouver la force de régularisation appropriée. La séance de cours explore en outre le besoin de représentations de données, les défis de l’hétérogénéité, de la taille et du bruit des données, et des techniques telles que Bag of Words pour les données textuelles et les dictionnaires visuels pour les données d’images. Il se termine par des discussions sur le prétraitement des données, la gestion des données déséquilibrées, la repondération des échantillons et la transition des représentations artisanales aux représentations apprises.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.