Cette séance de cours traite des défis en matière de contrôle, de sécurité et de coordination dans les systèmes dynamiques incertains, en mettant l'accent sur les systèmes autonomes comme les voitures autonomes. L'instructeur présente une approche de contrôle stochastique, des méthodes de vérification et un changement de paradigme vers l'apprentissage et l'interaction. La séance de cours porte sur la formulation de problèmes d'apprentissage sécuritaires, les défis de la boîte noire en matière d'information et une approche d'apprentissage sécuritaire proposée. Il explore également des études de cas sur l'apprentissage sécuritaire du renforcement et le travail continu dans l'apprentissage sécuritaire et le contrôle. L'instructeur se lance dans des systèmes multi-agents formalisés par la théorie du jeu, les équilibres Nash, l'apprentissage dans les jeux et l'apprentissage des équilibres Nash. La séance de cours se termine par des discussions sur l'optimisation du banditisme, la minimisation des regrets et les algorithmes d'apprentissage basés sur des modèles pour les équilibres Nash.