Cette séance de cours explore la relation entre les règles d'apprentissage neuronal et la dérivée du logarithme d'une politique, explorant les contributions post-synaptiques et pré-synaptiques dans les mises à jour de poids. Il explique comment les récompenses modulent les poids synaptiques et comment l’activité des neurones influence l’apprentissage.