Cette séance de cours introduit le concept d'espaces d'état et d'action continus dans le renforcement de l'apprentissage, en mettant l'accent sur les méthodes de transfert des techniques des espaces discrets aux espaces continus. Les sujets abordés comprennent l'approximation paramétrique, l'algorithme SARSA, les traces d'admissibilité et les résultats de la tâche de voiture de montagne.