Go (jeu)Le go, également appelé jeu de go, appelé en japonais , ou dans certaines expressions ; en chinois (), en Hanyu pinyin wéiqí, la prononciation shanghaïenne Wedji; et en coréen baduk (바둑), est un jeu de société originaire de Chine. Il oppose deux adversaires qui placent à tour de rôle des pierres, respectivement noires et blanches, sur les intersections d'un tablier quadrillé appelé goban en japonais ( en chinois). Le but est de contrôler le plan de jeu en y construisant des « territoires ».
Temporal difference learningLe Temporal Difference (TD) learning est une classe d'algorithmes d'apprentissage par renforcement sans modèle. Ces algorithmes échantillonnent l'environnement de manière aléatoire à la manière des méthodes de Monte Carlo. Ils mettent à jour la politique (i.e. les actions à prendre dans chaque état) en se basant sur les estimations actuelles, comme les méthodes de programmation dynamique. Les méthodes TD ont un lien avec les modèles TD dans l'apprentissage animal. vignette|151x151px|Diagramme backup.
Q-learningvignette|400x400px|Dans le Q-learning, l'agent exécute une action a en fonction de l'état s et d'une fonction Q. Il perçoit alors le nouvel état s' et une récompense r de l'environnement. Il met alors à jour la fonction Q. Le nouvel état s' devient alors l'état s, et l'apprentissage continue. En intelligence artificielle, plus précisément en apprentissage automatique, le Q-learning est un algorithme d'apprentissage par renforcement. Il ne nécessite aucun modèle initial de l'environnement.
Evaluation functionAn evaluation function, also known as a heuristic evaluation function or static evaluation function, is a function used by game-playing computer programs to estimate the value or goodness of a position (usually at a leaf or terminal node) in a game tree. Most of the time, the value is either a real number or a quantized integer, often in nths of the value of a playing piece such as a stone in go or a pawn in chess, where n may be tenths, hundredths or other convenient fraction, but sometimes, the value is an array of three values in the unit interval, representing the win, draw, and loss percentages of the position.
Intelligence ambiante[[Image:Evolution computer 1960-2010-fr.jpg|thumb|500px|right|L'évolution des ordinateurs : la course à la miniaturisation et à la diffusion dans le milieu ambiant. Parce que la technologie permet de fabriquer des ordinateurs minuscules et omniprésents (nano-informatique), elle ouvre à presque tous les objets de la vie courante, la capacité à déclencher un échange spontané d'informations, sans interaction avec leur utilisateur.
Embodied agentIn artificial intelligence, an embodied agent, also sometimes referred to as an interface agent, is an intelligent agent that interacts with the environment through a physical body within that environment. Agents that are represented graphically with a body, for example a human or a cartoon animal, are also called embodied agents, although they have only virtual, not physical, embodiment. A branch of artificial intelligence focuses on empowering such agents to interact autonomously with human beings and the environment.
Optimisation robusteL'optimisation robuste est une branche de l'optimisation mathématique qui cherche à résoudre un problème d'optimisation en prenant en compte les différentes sources d'incertitude de celui-ci. Les origines de l'optimisation robuste remontent aux débuts de la théorie de la décision moderne dans les années 1950. Des « analyses des cas les plus défavorables » ont été réalisées pour faire face aux fortes incertitudes.
Simulation de fouleLa simulation de foule est le procédé de simulation du mouvement d'un grand nombre de personnages, appelés agents ou entités. Elle est fréquemment employée en animation par ordinateur pour la réalisation de films ou de jeux vidéo. Elle est également utilisée pour la formation à des situations de crise la simulation des évacuations, les études de sécurité lors de la construction de bâtiments ou de l’organisation d’événements. Elle intervient aussi pour le design d'architecture et la planification urbaine, afin d’améliorer la qualité de service offert aux usagers.
Échecsvignette|Anand - Kramnik, championnat du monde en 2008. vignette|Une partie simultanée donnée par le GM ukrainien Andrij Maksimenko à Toruń, Pologne. vignette|Enluminure, Liber de Moribus, vers 1300. vignette|Joueurs sur un échiquier géant à Lugano, Suisse. alt=Propriété exclusive de Thelma Ackermann. |vignette|Famille de la noblesse française jouant aux échecs dans les années 1860, carte de visite.
Agent logicielEn informatique, un agent ou agent logiciel (du latin agere : agir) est un logiciel qui agit de façon autonome. C'est un programme qui accomplit des tâches à la manière d'un automate et en fonction de ce que lui a demandé son auteur. Dans le contexte d'Internet, les agents intelligents sont liés au Web sémantique, dans lequel ils sont utilisés pour faire à la place des humains les recherches et les corrélations entre les résultats de ces recherches. Ceci se fait en fonction de règles prédéfinies.