Séance de cours

Espace continu: espace d'action

Séances de cours associées (33)

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.

Connectez-vous pour utiliser Chat avec Graph Search

Agents d'apprentissage profond : Renforcement de l'apprentissage

Explore les agents d'apprentissage profond dans l'apprentissage du renforcement, en mettant l'accent sur les approximations du réseau neuronal et les défis dans la formation des systèmes multiactifs.

Renforcement de l'apprentissage : bases et applications

Couvre les bases de l'apprentissage du renforcement, y compris les processus décisionnels de Markov et les méthodes de gradient des politiques, et explore les applications du monde réel et les avancées récentes.

Systèmes multiagents distribués : coordination et apprentissage

Explore la coordination et l'apprentissage dans des systèmes multiagents distribués, couvrant les lois sociales, l'échange de tâches, la satisfaction des contraintes et les algorithmes de coordination.

Distributions et dérivés

Couvre les distributions, les dérivés, la convergence et les critères de continuité dans les espaces de fonctions.

Curiosité et récompense: Neurosciences à l'IA

S'insère dans la motivation intrinsèque, l'IA incarnée, la demande d'information, la nouveauté et la curiosité dans la prise de décision.

Éléments finis: Élasticité et formation variée

Explore les méthodes d'éléments finis pour les problèmes d'élasticité et les formulations variationnelles, en mettant l'accent sur les déformations admissibles et les implémentations numériques.

Renforcement de l'apprentissage : Q-Learning

Couvre l'apprentissage Q en renforçant l'apprentissage, en explorant les valeurs d'action, les politiques et l'impact sociétal des algorithmes.

Formalisme thermodynamique pour systèmes dynamiques en expansion grossière

Explore le formalisme thermodynamique pour les systèmes dynamiques en expansion faiblement grossière, couvrant les états d'équilibre, les paramètres visuels et le codage symbolique.

Opérateurs encombrés: Théorie et applications

Couvre les opérateurs délimités entre des espaces vectoriels normalisés, soulignant l'importance de la continuité et explorant des applications comme la transformation de Fourier.

Apprentissage par renforcement: Diagrammes de sauvegarde

Présente le diagramme de sauvegarde en tant que représentation graphique clé dans l'apprentissage par renforcement.