Séance de cours

Apprentissage par renforcement: Diagrammes de sauvegarde

Séances de cours associées (29)

Réseau neuronal Rapprochement et apprentissage

S'oriente vers l'approximation du réseau neuronal, l'apprentissage supervisé, les défis de l'apprentissage à haute dimension et la révolution expérimentale de l'apprentissage profond.

Réseaux neuronaux pour la PNL

Couvre les approches modernes du réseau neuronal en matière de PNL, en mettant l'accent sur l'intégration de mots, les réseaux neuronaux pour les tâches de PNL et les futures techniques d'apprentissage par transfert.

Deep Learning : réseaux neuronaux convolutifs

Couvre les réseaux neuronaux convolutifs, les architectures standard, les techniques de formation et les exemples contradictoires en apprentissage profond.

Algorithmes gradués dans l'apprentissage à haute dimension

Fournit des informations sur les algorithmes basés sur les gradients, les mystères d'apprentissage profond, et les défis des problèmes non convexes.

Systèmes de connaissances non conceptuels

Explore l'impact de l'apprentissage profond sur les humanités numériques, en se concentrant sur les systèmes de connaissances non conceptuels et les progrès récents de l'IA.

Apprentissage par renforcement : TD Learning et les variantes de la LEP

Discute de l'apprentissage par renforcement, en se concentrant sur l'apprentissage par différence temporelle et les variations de l'algorithme SARSA.

Concepts d'apprentissage par renforcement

Couvre les concepts clés de l'apprentissage par renforcement, des réseaux neuronaux, du clustering et de l'apprentissage non supervisé, en mettant l'accent sur leurs applications et leurs défis.

Mini-bateaux dans l'apprentissage de renforcement profond sur-et-hors-politique

Explique l'importance des mini-lots dans l'apprentissage par renforcement profond et les différences entre les méthodes on-policy et off-policy.

Apprentissage des caractéristiques: Stabilité et malédiction de la dimensionnalité

Explore comment les architectures modernes ont vaincu la malédiction de la dimensionnalité et l'importance de la stabilité dans les modèles d'apprentissage en profondeur.