Catégorie

Apprentissage par renforcement

Concepts associés (25)

AlphaZero est une version généraliste d’AlphaGo Zero, un logiciel de go (jeu de stratégie abstrait chinois) qui a été adapté pour jouer aux échecs et au shogi (échecs japonais). AlphaZero a été créé par Demis Hassabis de DeepMind, une entreprise appartenant au groupe Google. Le , DeepMind poste sur la plateforme de prépublication arXiv un article concernant AlphaZero, un programme utilisant l’approche généralisée d'AlphaGo Zero. Le style de jeu d'AlphaZero s'écarte des programmes de jeu habituels tout en requérant moins de calculs par mouvement en regard de ses concurrents.

Algorithme de recherche

En informatique, un algorithme de recherche est un type d'algorithme qui, pour un domaine, un problème de ce domaine et des critères donnés, retourne en résultat un ensemble de solutions répondant au problème. Supposons que l'ensemble de ses entrées soit divisible en sous-ensemble, par rapport à un critère donné, qui peut être, par exemple, une relation d'ordre. De façon générale, un tel algorithme vérifie un certain nombre de ces entrées et retourne en sortie une ou plusieurs des entrées visées.

Chess.com

Chess.com est un serveur internet d'échecs, créé dans sa version actuelle en mai 2007. Il s'agit également d'un forum internet et d'un réseau social consacré aux échecs ainsi que d'une application mobile. En 2021, le site figure parmi les principaux serveurs d'échecs. En 2023, le site est considéré comme le serveur d'échecs le plus important du monde en termes de trafic. Il organise régulièrement des tournois de parties rapides et de blitz auxquels participent les meilleurs joueurs du monde. Chess.

Apprentissage par renforcement profond

L'apprentissage par renforcement profond (en anglais : deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais : machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais : deep learning). L'apprentissage par renforcement considère le problème d'un agent informatique (par exemple, un robot, un agent conversationnel, un personnage dans un jeu vidéo, etc.) qui apprend à prendre des décisions par essais et erreurs.

Stockfish (programme d'échecs)

Stockfish est un moteur d'échecs libre développé principalement par Marco Costalba, Joona Kiiski, Gary Linscott, Stéphane Nicolet, Tord Romstad et Joost VandeVondele, avec également de nombreuses contributions d'une large communauté de développeurs open source. Il est distribué gratuitement sous la licence publique générale GNU version 3 ou ultérieure. Depuis les années 2010, Stockfish est régulièrement classé premier ou près du haut de la liste de la plupart des classements des moteurs d'échecs ; il est considéré comme le moteur d'échecs conventionnel de cette période le plus puissant du monde.

Concepts associés (25)

AlphaZero

Algorithme de recherche

Chess.com

Apprentissage par renforcement profond

Stockfish (programme d'échecs)