Séances de cours associées à Renforcement des principes de l'apprentissage grâce à la rétroaction humaine

Spin Glasses et estimation bayésienne

Couvre les concepts de lunettes de spin et d'estimation bayésienne, en se concentrant sur l'observation et la déduction de l'information d'un système de près.

Théorie statistique : estimation maximale de vraisemblance

Explore la cohérence et les propriétés asymptotiques de l’estimateur de vraisemblance maximale, y compris les défis à relever pour prouver sa cohérence et construire des estimateurs de type MLE.

Estimateurs et intervalles de confiance

Explore le biais, la variance, les estimateurs non biaisés et les intervalles de confiance dans l'estimation statistique.

Deep Learning: Pas de théorie du déjeuner gratuit et biais inductifs

Couvre le No Free Lunch Theorem et le rôle des biais inductifs dans l'apprentissage profond et l'apprentissage par renforcement.

Apprentissage Bio-Inspiré: Réseaux Neuraux, Algorithmes Génétiques

Explore l'apprentissage bio-inspiré avec des réseaux neuronaux et des algorithmes génétiques, couvrant la structure, la formation et les applications pratiques.

Intervalles de confiance : définition et estimation

Explique les intervalles de confiance, les méthodes d'estimation des paramètres et le théorème de la limite centrale dans l'inférence statistique.

Estimation et intervalles de confiance

Explore les biais, la variance et les intervalles de confiance dans l'estimation des paramètres à l'aide d'exemples et de distributions.

Perception : Approches fondées sur les données

Explore la perception dans l'apprentissage profond pour les véhicules autonomes, couvrant la classification d'image, les méthodes d'optimisation, et le rôle de la représentation dans l'apprentissage automatique.

Prédiction sans modèle dans l'apprentissage par renforcement: méthodes clés

Couvre les méthodes de prédiction sans modèle dans l'apprentissage par renforcement, en se concentrant sur Monte Carlo et les différences temporelles pour estimer les fonctions de valeur sans connaissance de la dynamique de transition.

Renforcement de l'apprentissage : bases et applications

Couvre les bases de l'apprentissage du renforcement, y compris les processus décisionnels de Markov et les méthodes de gradient des politiques, et explore les applications du monde réel et les avancées récentes.

Modèles probabilistes pour la régression linéaire

Couvre le modèle probabiliste de régression linéaire et ses applications dans la résonance magnétique nucléaire et l'imagerie par rayons X.

Modèles statistiques et estimation des paramètres

Explore les modèles statistiques, l'estimation des paramètres et les distributions d'échantillonnage dans les probabilités et les statistiques.

Statistiques pour la science des données: introduction aux méthodes statistiques

Couvre les concepts fondamentaux de la statistique et leur application dans la science des données.

Agents d'apprentissage: Tradeoff Exploration-Exploitation

Explore le compromis exploration-exploitation dans l'apprentissage des effets inconnus des actions en utilisant des bandits multi-armés et Q-learning.

La généralisation dans l'apprentissage profond

Explore la généralisation dans l'apprentissage profond, couvrant la complexité du modèle, le biais implicite, et le phénomène de double descente.

Méthodes d'estimation dans les probabilités et les statistiques

Discute des méthodes d'estimation en probabilité et en statistiques, en se concentrant sur l'estimation du maximum de vraisemblance et les intervalles de confiance.

Agents d'apprentissage profond : Renforcement de l'apprentissage

Explore les agents d'apprentissage profond dans l'apprentissage du renforcement, en mettant l'accent sur les approximations du réseau neuronal et les défis dans la formation des systèmes multiactifs.

Acquérir des données pour l'apprentissage : approches et défis modernes

Explore les approches et les défis modernes en matière d'acquisition de données pour l'apprentissage de contrôleurs optimaux au moyen de démonstrations et de méthodes axées sur les données.

Théorie statistique : Cramér-Rao Bound & Hypothesis Testing

Explore la limite de Cramér-Rao, les tests d'hypothèses et l'optimalité en théorie statistique.

Importance statistique : estimation maximale de vraisemblance et intervalles de confiance

Explore les erreurs de type I et de type II, les valeurs critiques et les intervalles de confiance dans la signification statistique.