Séances de cours associées à Go en informatique

Estimation de la pose à la main

Couvre l'estimation de la pose de la main, les techniques de régression et l'évolution des modèles de classification d'images de LeNet à VGG19.

Résoudre le 4 : la taille A-B et la recherche de l'arbre Monte-Carlo

Explore l'application de la théorie du jeu pour optimiser les stratégies dans Connect Four à l'aide d'algorithmes avancés.

Connect quatre: α-β Taille vs Monte-Carlo Tree Search

Explore les stratégies pour résoudre Connect Four en utilisant la taille α-β et la recherche d'arbres Monte-Carlo.

Résoudre Connect Four: Stratégies de théorie du jeu

Explore les stratégies de théorie de jeu pour résoudre Connect Four efficacement en utilisant minimax, alpha-bêta taille, et les méthodes Monte Carlo.

Apprentissage par renforcement profond basé sur des modèles: Monte Carlo Tree Search

Explore l'apprentissage par renforcement profond basé sur des modèles, en se concentrant sur Monte Carlo Tree Search et ses applications dans les stratégies de jeu et les processus décisionnels.

Renforcement de l'apprentissage : Q-Learning

Introduit Q-Learning, Deep Q-Learning, l'algorithme REINFORCE et Monte-Carlo Tree Search dans l'apprentissage par renforcement, aboutissant à AlphaGo Zero.

Résoudre le 4 : la taille A-B et la recherche de l'arbre Monte-Carlo

Explore la résolution Connect Four en utilisant des algorithmes de théorie de jeu et compare leur efficacité.

Résoudre le 4 : la taille A-B et la recherche de l'arbre Monte-Carlo

Explorer la résolution Connect Four en utilisant la théorie du jeu et l'optimisation des algorithmes, en comparant minimax, taille alpha-bêta, et recherche d'arbre Monte-Carlo.

Connect Four: Approche de théorie du jeu

Explore résolution Connect Four en utilisant des algorithmes de théorie de jeu pour trouver des stratégies optimales efficacement.

Quatre connexions : Alpha-Beta Pruning et Monte-Carlo Tree Search

Explore la résolution Connect Four en utilisant des algorithmes de théorie de jeu et compare leurs performances.

Potentiels interatomiques: Construction et évaluation

Explore la construction et l'évaluation des potentiels interatomiques de stabilité et de réactivité atomiques.

Monte Carlo Tree Search et Alpha Zero

Explore Monte Carlo Tree Search et Alpha Zero dans l'apprentissage par renforcement profond.

Agents délibératifs : planification et stratégies

Couvre la planification avec des adversaires, des algorithmes de recherche heuristique et des stratégies pour les jeux avec le hasard, en soulignant l'importance des agents délibératifs.

Quatre connexions : Alpha-Beta Pruning et Monte-Carlo Tree Search

Explorer la résolution Connect Four en utilisant des algorithmes de théorie de jeu et compare la taille Alpha-Beta avec la recherche d'arbre Monte-Carlo.

RL profonde basée sur le modèle: planification et VAST

Couvre l'apprentissage par modèle, la planification, la tabulation des états variables et la mise à jour efficace des valeurs Q et V.

MuZero: Modèle de planification et d'apprentissage

Couvre MuZero, un modèle qui apprend à prédire les récompenses et les actions de manière itérative, réalisant des performances de pointe dans les jeux de société et les jeux vidéo Atari.