Séances de cours associées à Stability (learning theory)

Erreur de généralisation

Explore l'erreur de généralisation dans l'apprentissage automatique, en se concentrant sur la distribution des données et l'impact des hypothèses.

Compréhension automatique du monde visuel

Explore la perception visuelle de la machine, l'apprentissage faiblement supervisé et la recherche future dans les systèmes intelligents.

Prédiction sans modèle dans l'apprentissage par renforcement: méthodes clés

Couvre les méthodes de prédiction sans modèle dans l'apprentissage par renforcement, en se concentrant sur Monte Carlo et les différences temporelles pour estimer les fonctions de valeur sans connaissance de la dynamique de transition.

Mathématiques des données : Introduction au Deep Learning

Couvre une introduction mathématique à l'apprentissage profond, y compris les défis, la puissance des classificateurs linéaires, l'échelle du modèle et les aspects théoriques.

Méthodes de gradient de politique: Techniques d'apprentissage par renforcement

Fournit un aperçu des méthodes de gradient de politique dans l'apprentissage par renforcement, en se concentrant sur le tour de log-vraisemblance et la transition de l'apprentissage par lots à l'apprentissage en ligne.

Images de médias sociaux : Comprendre la perception de l’alimentation avec l’apprentissage profond

Explore l’apprentissage profond avec des images Instagram, comprend la perception des aliments, l’obésité et la santé mentale, et discute de l’impact des images des médias sociaux et des plateformes éphémères comme Snapchat.

Fondements de l'apprentissage profond: Aperçu de l'architecture transformatrice

Couvre les concepts fondamentaux de l'apprentissage profond et de l'architecture Transformer, en se concentrant sur les réseaux neuronaux, les mécanismes d'attention et leurs applications dans les tâches de modélisation de séquence.

Apprentissage Sparse Caractéristiques: Encombrant dans les réseaux neuraux

Discuter de la façon dont l'apprentissage de caractéristiques éparses peut conduire à une suradaptation dans les réseaux neuraux malgré des preuves empiriques de généralisation.

Classificateurs voisins les plus près et malédiction de dimensionnalité

Explore les classificateurs voisins les plus proches, le compromis entre les biais, la malédiction de la dimensionnalité et les limites de généralisation dans l'apprentissage automatique supervisé.

Méthodes de gradient de politique: apprentissage par l'action directe dans l'apprentissage par renforcement

Couvre les méthodes de gradient de politique, en mettant l'accent sur l'apprentissage par l'action directe et l'optimisation des récompenses dans l'apprentissage par renforcement.