Séance de cours

Apprentissage par renforcement: Exploration, Attribution de crédit, TRPO, PPO

Séances de cours associées (32)
Systèmes de maintenance intelligents
Discute des défauts de maintenance intelligente, Denoising Sparse Wavelet Network, Koopman operator theory et Graph Neural Networks.
Programmation du robot ThymioMOOC: Die digitale Welt mit dem Thymio Roboter entdecken
Plonge dans des méthodes de programmation alternatives pour le robot Thymio et l'intégration d'un Raspberry Pi pour des capacités améliorées.
Réduction des risques de catastrophe: Préparation et technologieMOOC: A Resilient Future: Science and Technology for Disaster Risk Reduction
S'engager dans la réduction des risques de catastrophe par la préparation, en mettant l'accent sur la coordination et la technologie pour la résilience.
Analyse du cycle de vie : étude d'impact environnemental
Compare le bioplastique et le plastique traditionnel, en soulignant l'importance de l'évaluation de l'impact sur l'environnement et des processus décisionnels.
Séance de cours interactive : Apprentissage du renforcement
Explore les sujets d'apprentissage avancés du renforcement, y compris les politiques, les fonctions de valeur, la récursion de Bellman et le contrôle de la TD sur les politiques.
Présentation de la gamification
Explore la gamification, la ludification et l'éducation en éducation numérique, y compris l'apprentissage basé sur les jeux et les jeux sérieux.
Modélisation d'une voiture étudiante de Formule sur un simulateur de conduite
Explore la modélisation d'une voiture Formula Student sur un simulateur de conduite supervisé par le professeur Colin Jones, y compris un test d'autocross et un défi d'endurance.
Les humanités numériques à l'échelle
Déplacez-vous dans les progrès des humanités numériques de 2012 à 2032, en mettant l'accent sur les technologies d'apprentissage profond pour l'analyse de documents historiques.
Échanges de devises
Explore le sous-ajustement, le surajustement et le compromis entre les variables de biais dans les modèles d'apprentissage automatique.
Réseaux neuronaux multicouches: Deep Learning
Couvre les fondamentaux des réseaux neuronaux multicouches et de l'apprentissage profond.

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.