Concept

Google DeepMind

Séances de cours associées (30)

Couvre les bases de l'apprentissage par renforcement, y compris l'apprentissage Q et les réseaux neuronaux.

Apprentissage profond pour les véhicules autonomes: modèles prédictifs

Explore les modèles prédictifs et les traceurs pour les véhicules autonomes, couvrant la détection d'objets, les défis de suivi, le suivi en réseau neuronal et la localisation des piétons en 3D.

Consultant numérique : EPFL 2021

Explore le rôle d'un consultant numérique dans le développement d'applications innovantes.

Apprentissage par renforcement: Diagrammes de sauvegarde

Présente le diagramme de sauvegarde en tant que représentation graphique clé dans l'apprentissage par renforcement.

Q-Learning profond: DeepRL1.1

Couvre le Q-learning profond dans les réseaux neuronaux profonds, son application dans les jeux, la rétropropagation, les valeurs Q et les valeurs V.

Apprentissage par renforcement: gradient de politique et méthodes critiques pour les acteurs

Fournit une vue d'ensemble de l'apprentissage par renforcement, en se concentrant sur le gradient de politique et les méthodes critiques des acteurs pour les réseaux de neurones artificiels profonds.

Sensorimotor Contingence: Amir Zamir

Par Amir Zamir explore la contingence sensorimotrice, l’intelligence sans représentation, l’apprentissage des programmes et les stratégies d’apprentissage automatique.

Apprentissage par renforcement : TD Learning et les variantes de la LEP

Discute de l'apprentissage par renforcement, en se concentrant sur l'apprentissage par différence temporelle et les variations de l'algorithme SARSA.

Deep Learning pour les véhicules autonomes

Explore l'apprentissage profond pour les véhicules autonomes, couvrant la perception, l'action et les prévisions sociales dans le contexte des technologies de capteurs et des considérations éthiques.

Méthodes de gradient de politique: apprentissage par l'action directe dans l'apprentissage par renforcement

Couvre les méthodes de gradient de politique, en mettant l'accent sur l'apprentissage par l'action directe et l'optimisation des récompenses dans l'apprentissage par renforcement.