Publication

Alternation makes the adversary weaker in two-player games

Concepts associés (32)

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.

Connectez-vous pour utiliser Chat avec Graph Search

Bandit manchot (mathématiques)

vignette|Une rangée de machines à sous à Las Vegas. En mathématiques, plus précisément en théorie des probabilités, le problème du bandit manchot (généralisable en problème du bandit à K bras ou problème du bandit à N bras) se formule de manière imagée de la façon suivante : un utilisateur (un agent), face à des machines à sous, doit décider quelles machines jouer. Chaque machine donne une récompense moyenne que l'utilisateur ne connait pas a priori. L'objectif est de maximiser le gain cumulé de l'utilisateur.

Multijoueur

thumb|Jeu multijoueur. Un jeu vidéo multijoueur permet à plusieurs personnes de participer ensemble et simultanément à une même partie. Cette fonctionnalité peut se réaliser soit en partageant le matériel (exemple : un jeu multijoueur sur une console de salon qui divise l'écran en fonction du nombre de joueurs), soit en mode de jeu en réseau sur plusieurs plates-formes de jeu distinctes qui communiquent entre elles au travers d'un réseau informatique (soit entre particuliers en réseau local, soit sur un jeu en ligne via Internet).

Algorithme du gradient stochastique

L'algorithme du gradient stochastique est une méthode de descente de gradient (itérative) utilisée pour la minimisation d'une fonction objectif qui est écrite comme une somme de fonctions différentiables. À la fois l'estimation statistique et l'apprentissage automatique s'intéressent au problème de la minimisation d'une fonction objectif qui a la forme d'une somme : où le paramètre qui minimise doit être estimé. Chacune des fonctions est généralement associée avec la -ème observation de l'ensemble des données (utilisées pour l'apprentissage).

Agent logiciel

En informatique, un agent ou agent logiciel (du latin agere : agir) est un logiciel qui agit de façon autonome. C'est un programme qui accomplit des tâches à la manière d'un automate et en fonction de ce que lui a demandé son auteur. Dans le contexte d'Internet, les agents intelligents sont liés au Web sémantique, dans lequel ils sont utilisés pour faire à la place des humains les recherches et les corrélations entre les résultats de ces recherches. Ceci se fait en fonction de règles prédéfinies.

Q-learning

vignette|400x400px|Dans le Q-learning, l'agent exécute une action a en fonction de l'état s et d'une fonction Q. Il perçoit alors le nouvel état s' et une récompense r de l'environnement. Il met alors à jour la fonction Q. Le nouvel état s' devient alors l'état s, et l'apprentissage continue. En intelligence artificielle, plus précisément en apprentissage automatique, le Q-learning est un algorithme d'apprentissage par renforcement. Il ne nécessite aucun modèle initial de l'environnement.

Sparse dictionary learning

Sparse dictionary learning (also known as sparse coding or SDL) is a representation learning method which aims at finding a sparse representation of the input data in the form of a linear combination of basic elements as well as those basic elements themselves. These elements are called atoms and they compose a dictionary. Atoms in the dictionary are not required to be orthogonal, and they may be an over-complete spanning set. This problem setup also allows the dimensionality of the signals being represented to be higher than the one of the signals being observed.

Motivation

La motivation désigne, au sein d'un organisme vivant, la composante ou le processus en jeu pour l'engagement dans une activité précise. Elle en détermine le déclenchement, la direction, l'intensité et en assure la prolongation jusqu'à l'aboutissement ou l'interruption. Cette notion se distingue du potentiel, de l'odorat ou encore de l'optimisme. La motivation prend de nos jours une place de premier plan dans les organisations. Elle est déterminante pour l'apprentissage (y compris chez les nourrissons) et génère la productivité dans de nombreuses activités personnelles ou professionnelles.

Apprentissage

L’apprentissage est un ensemble de mécanismes menant à l'acquisition de savoir-faire, de savoirs ou de connaissances. L'acteur de l'apprentissage est appelé apprenant. On peut opposer l'apprentissage à l'enseignement dont le but est de dispenser des connaissances et savoirs, l'acteur de l'enseignement étant l'enseignant.

Langues slaves

Les langues slaves sont des langues indo-européennes, du groupe balto-slave. Les langues slaves forment un groupe de langues important dont les locuteurs se situent majoritairement en Europe centrale, Balkans, Europe de l'Est, Sibérie, Extrême-Orient russe, Asie centrale. Le groupe des langues slaves se décompose en trois familles de langues : orientale, occidentale et méridionale. Pour cette dernière, il existe pour le diasystème slave du centre-sud des dénominations politiques conformes aux recensements des pays slaves méridionaux, et des dénominations linguistiques conformes aux classifications des linguistes.

Present value

In economics and finance, present value (PV), also known as present discounted value, is the value of an expected income stream determined as of the date of valuation. The present value is usually less than the future value because money has interest-earning potential, a characteristic referred to as the time value of money, except during times of zero- or negative interest rates, when the present value will be equal or more than the future value. Time value can be described with the simplified phrase, "A dollar today is worth more than a dollar tomorrow".