Cette séance de cours explore une version biologiquement inspirée de la tâche classique de l'apprentissage par renforcement, où l'instructeur discute de l'hippocampe, place des cellules dans le cerveau du rat, le Morris Water Maze, modélise une tâche de labyrinthe, la navigation de labyrinthe avec Actor-Critic, et la mise en œuvre des neurones de spiking. La séance de cours se termine par un résumé reliant l'apprentissage TD dans un cadre acteur-critique aux fonctions cérébrales et présentant la possibilité d'apprendre dans quelques essais avec une représentation sensorielle bien adaptée.