Cette séance de cours présente le concept de renforcement de l'apprentissage appliqué aux neurorobotiques, en mettant l'accent sur la mise en œuvre de l'algorithme SARSA dans un environnement simulé. L'instructeur présente l'adaptation des cartes auto-organisationnelles pour l'ASRA, le modèle d'action-récompense-action de l'État et le compromis d'exploration-exploitation dans la prise de décision des robots. La séance de cours se termine par une démonstration de la formation en SARSA dans un environnement simulé, montrant le processus d'apprentissage et les récompenses obtenues.