Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre le concept de l'exécution des systèmes réactifs, en se concentrant sur la synthèse de boucliers pour assurer un comportement correct du système tout en déviant seulement lorsque nécessaire. Les sujets comprennent le raisonnement symbolique, la synthèse des boucliers à l'aide de jeux, et des exemples comme les contrôleurs de feux de circulation. L'instructeur discute de l'application des boucliers dans l'apprentissage automatique pour l'apprentissage sécuritaire du renforcement, avec une étude de cas sur le blindage Pac-Man. La séance de cours explore également une synthèse optimale des boucliers, traitant du trafic des heures de pointe, et des boucliers probabilistes de sécurité pour Pac-Man. L'utilisation de boucliers pour l'amélioration du rendement et l'évolutivité dans les processus décisionnels Markov importants est également abordée.