Explore l'apprentissage du renforcement, en mettant l'accent sur la mise à jour des valeurs d'action antérieures le long de la trajectoire à l'aide de l'algorithme SARSA.
Explore la théorie des groupes en physique quantique, en mettant l'accent sur les représentations réductibles et irréductibles, les lois de conservation et les propriétés de groupe.
Couvre le champ électromagnétique (EM) dans la théorie quantique des champs II, en discutant des transformations de jauge, des principes de symétrie et de la quantification de champ.
Couvre les méthodes de gradient de politique dans l'apprentissage du renforcement, en se concentrant sur les techniques d'optimisation et les applications pratiques comme le problème du poteau.