State space (computer science)

Applied sciences
Information engineering
Automatique
Théorie du contrôle

Séances de cours associées (32)

Connectez-vous pour filtrer par séance de cours

À propos
Confidentialité
Mentions légales

Graph Chatbot

Connectez-vous pour filtrer par séance de cours

Introduit le filtre Kalman pour estimer l'état d'un système dynamique à partir de mesures bruyantes, couvrant la prédiction, la mise à jour et les étapes de filtrage.

Renforcement de l'apprentissage : Q-Learning

Introduit Q-Learning, Deep Q-Learning, l'algorithme REINFORCE et Monte-Carlo Tree Search dans l'apprentissage par renforcement, aboutissant à AlphaGo Zero.