Cette séance de cours fournit une introduction à l'apprentissage par renforcement (RL), décrivant ses concepts fondamentaux et ses applications. Il commence par un aperçu de la structure et des objectifs du cours, en soulignant l'importance de RL dans divers domaines tels que l'automatisation, la finance et la robotique. L'instructeur discute des définitions classiques de RL, en soulignant le processus d'apprentissage pour cartographier les situations en actions afin de maximiser les récompenses. Les thèmes clés comprennent l'interaction entre les agents et les environnements, l'importance des récompenses et les défis posés par les données non stationnaires et les commentaires différés. La séance de cours couvre également les perceptions de RL dans différentes disciplines, y compris la théorie du contrôle et l'apprentissage automatique. L'instructeur présente des exemples d'applications RL, telles que les voitures autonomes et l'IA de jeu, et discute des fondements théoriques nécessaires à la compréhension des algorithmes RL. La session se termine par un aperçu des sujets à venir, y compris la programmation dynamique et l'itération des politiques, ouvrant la voie à une exploration plus approfondie des méthodologies RL dans les séance de courss suivantes.