Séance de cours

Représentations et traitement des données

Description

Cette séance de cours couvre les concepts de sur-ajustement vs sous-ajustement, la sélection du modèle en utilisant la validation croisée, LOOCV, k-fold validation croisée, et limportance de pénaliser le sur-ajustement dans les modèles dapprentissage automatique. Il explore également la régression linéaire régularisée, la régression des crêtes du noyau et l'importance de trouver la force de régularisation appropriée. La séance de cours explore en outre le besoin de représentations de données, les défis de l’hétérogénéité, de la taille et du bruit des données, et des techniques telles que Bag of Words pour les données textuelles et les dictionnaires visuels pour les données d’images. Il se termine par des discussions sur le prétraitement des données, la gestion des données déséquilibrées, la repondération des échantillons et la transition des représentations artisanales aux représentations apprises.

Source officielle

Proximité ontologique

Statistique

Analyse des données: Validation croisée

Séances de cours associées (31)

Représentations et traitement des données

Explore les représentations de données, le surajustement, la sélection des modèles, la validation croisée et les défis de données déséquilibrés.

Représentation des données : BoW et données déséquilibrées

Couvre les problèmes de surajustement, de sélection de modèle, de validation, de validation croisée, de régularisation, de régression du noyau et de représentation des données.

Overfitting dans l'apprentissage supervisé: études de cas et techniques

Aborde l'ajustement excessif dans l'apprentissage supervisé par le biais d'études de cas de régression polynomiale et de techniques de sélection de modèles.

Fondements de l'apprentissage automatique : régularisation et validation croisée

Explore le surajustement, la régularisation et la validation croisée dans l'apprentissage automatique, soulignant l'importance de l'expansion des fonctionnalités et des méthodes du noyau.

Complexité du modèle et suréquipement dans l'apprentissage automatique

Couvre la complexité du modèle, l'ajustement excessif et les stratégies pour sélectionner les modèles d'apprentissage automatique appropriés.

Afficher plus