Séance de cours

Application de la loi sur les temps d'exécution pour les systèmes réactifs : synthèse de bouclier

Description

Cette séance de cours couvre le concept de l'exécution des systèmes réactifs, en se concentrant sur la synthèse de boucliers pour assurer un comportement correct du système tout en déviant seulement lorsque nécessaire. Les sujets comprennent le raisonnement symbolique, la synthèse des boucliers à l'aide de jeux, et des exemples comme les contrôleurs de feux de circulation. L'instructeur discute de l'application des boucliers dans l'apprentissage automatique pour l'apprentissage sécuritaire du renforcement, avec une étude de cas sur le blindage Pac-Man. La séance de cours explore également une synthèse optimale des boucliers, traitant du trafic des heures de pointe, et des boucliers probabilistes de sécurité pour Pac-Man. L'utilisation de boucliers pour l'amélioration du rendement et l'évolutivité dans les processus décisionnels Markov importants est également abordée.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.