Passer au contenu principal
Séance de cours

Apprentissage du renforcement: processus Markov et optimisation des politiques