Cette séance de cours présente des stratégies pour l'exploration de robots à longue distance dans des espaces d'action continue, en mettant l'accent sur la recherche multi-objets. L'approche combine la pensée de l'horizon long avec le contrôle de l'horizon court, étendant la recherche multi-objets aux espaces d'action continue. La séance de cours détaille l'architecture, où une tête prédictive guide la direction vers le prochain objet le plus proche, et la politique peut suivre ou s'écarter des objectifs de longue période. Les résultats de la formation et des essais dans différents environnements sont discutés, ce qui démontre l'efficacité de l'approche proposée.