AlphaZero est une version généraliste d’AlphaGo Zero, un logiciel de go (jeu de stratégie abstrait chinois) qui a été adapté pour jouer aux échecs et au shogi (échecs japonais). AlphaZero a été créé par Demis Hassabis de DeepMind, une entreprise appartenant au groupe Google.
Le , DeepMind poste sur la plateforme de prépublication arXiv un article concernant AlphaZero, un programme utilisant l’approche généralisée d'AlphaGo Zero. Le style de jeu d'AlphaZero s'écarte des programmes de jeu habituels tout en requérant moins de calculs par mouvement en regard de ses concurrents.
Selon DeepMind, AlphaZero a atteint en 24 heures un niveau de jeu supérieur aux humains au jeu d'échecs, au shogi et au go en battant les programmes champions du monde Stockfish (échecs), (shogi) et la version d’AlphaGo Zero ayant eu trois jours d'apprentissage.
Le même mois, AlphaZero bat la version AlphaGo Zero (ayant 3 jours d’apprentissage) 60 parties à 40. Avec 8 heures de pratique et 21 millions de parties jouées contre lui-même, il surpasse la version d’AlphaGo du match contre Lee Sedol au classement Elo.
Stockfish, le logiciel champion du monde d'échecs est battu après 4 heures d'apprentissage et 44 millions de parties jouées. Toutefois, Stockfish n'avait pas le droit d'utiliser ses bibliothèques d'ouvertures et de finales.
Le programme de shogi Elmo est terrassé après deux heures de pratique et 24 millions de parties.
AlphaZero possède désormais un réseau de neurones mis à jour de manière continue et possède des règles codées pour l’établissement de recherche d’hyperparamètres. Par ailleurs, il n'a pas été programmé pour profiter des symétries propres au jeu de go (possibilités de réflexions et rotations), inexistantes dans le jeu d'échecs, et peut prendre en compte la possibilité d'une partie nulle (inexistant au jeu de go mais présent aux échecs).
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
Stockfish est un moteur d'échecs libre développé principalement par Marco Costalba, Joona Kiiski, Gary Linscott, Stéphane Nicolet, Tord Romstad et Joost VandeVondele, avec également de nombreuses contributions d'une large communauté de développeurs open source. Il est distribué gratuitement sous la licence publique générale GNU version 3 ou ultérieure. Depuis les années 2010, Stockfish est régulièrement classé premier ou près du haut de la liste de la plupart des classements des moteurs d'échecs ; il est considéré comme le moteur d'échecs conventionnel de cette période le plus puissant du monde.
Chess.com est un serveur internet d'échecs, créé dans sa version actuelle en mai 2007. Il s'agit également d'un forum internet et d'un réseau social consacré aux échecs ainsi que d'une application mobile. En 2021, le site figure parmi les principaux serveurs d'échecs. En 2023, le site est considéré comme le serveur d'échecs le plus important du monde en termes de trafic. Il organise régulièrement des tournois de parties rapides et de blitz auxquels participent les meilleurs joueurs du monde. Chess.
AlphaGo est un programme informatique capable de jouer au jeu de go, développé par l'entreprise britannique DeepMind et racheté en 2014 par Google. En , il devient le premier programme à battre un joueur professionnel (le français Fan Hui) sur un goban de taille normale (19×19) sans handicap. Il s'agit d'une étape symboliquement forte puisque le programme joueur de go est alors un défi complexe de l'intelligence artificielle. En , il bat Lee Sedol, un des meilleurs joueurs mondiaux ( professionnel).
Since 2010 approaches in deep learning have revolutionized fields as diverse as computer vision, machine learning, or artificial intelligence. This course gives a systematic introduction into influent
This course provides the students with 1) a set of theoretical concepts to understand the machine learning approach; and 2) a subset of the tools to use this approach for problems arising in mechanica
Software agents are widely used to control physical, economic and financial processes. The course presents practical methods for implementing software agents and multi-agent systems, supported by prog
This paper presents an ultra-low-power voice activity detector (VAD). It uses analog signal processing for acoustic feature extraction (AFE) directly on the microphone output, approximate event-driven analog-to-digital conversion (ED-ADC), and digital deep ...