Théorie des perspectivesLa théorie des perspectives (en anglais : Prospect theory) est une théorie économique développée par Daniel Kahneman et Amos Tversky en 1979. Elle remet en cause la théorie de l'utilité espérée développée par John von Neumann et Oskar Morgenstern en 1944 et a valu à Daniel Kahneman le prix Nobel d'économie en 2002. Cette théorie est fondatrice de l'économie comportementale et de la finance comportementale et constitue l'une des premières théories économiques construite à partir de travaux expérimentaux.
Réseau bayésienEn informatique et en statistique, un réseau bayésien est un modèle graphique probabiliste représentant un ensemble de variables aléatoires sous la forme d'un graphe orienté acyclique. Intuitivement, un réseau bayésien est à la fois : un modèle de représentation des connaissances ; une « machine à calculer » des probabilités conditionnelles une base pour des systèmes d'aide à la décision Pour un domaine donné (par exemple médical), on décrit les relations causales entre variables d'intérêt par un graphe.
ApprentissageL’apprentissage est un ensemble de mécanismes menant à l'acquisition de savoir-faire, de savoirs ou de connaissances. L'acteur de l'apprentissage est appelé apprenant. On peut opposer l'apprentissage à l'enseignement dont le but est de dispenser des connaissances et savoirs, l'acteur de l'enseignement étant l'enseignant.
Apprentissage par renforcementEn intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome ( robot, agent conversationnel, personnage dans un jeu vidéo), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps. L'agent est plongé au sein d'un environnement et prend ses décisions en fonction de son état courant. En retour, l'environnement procure à l'agent une récompense, qui peut être positive ou négative.
Théorie de l'utilité espéréeLa théorie de l'utilité espérée (aussi appelée théorie EU, de l'anglais « expected utility ») est une théorie de la décision en environnement risqué développée par John von Neumann et Oskar Morgenstern dans leur ouvrage Theory of Games and Economic Behavior (1944). Introduisons d'abord quelques notations: L'incertitude est décrite par un ensemble d'états du monde partitionné par la famille de parties (de taille ). Un élément de est appelé événement. Une variable aléatoire est une fonction qui associe à chaque un résultat noté .
Apprentissage par renforcement profondL'apprentissage par renforcement profond (en anglais : deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais : machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais : deep learning). L'apprentissage par renforcement considère le problème d'un agent informatique (par exemple, un robot, un agent conversationnel, un personnage dans un jeu vidéo, etc.) qui apprend à prendre des décisions par essais et erreurs.
Événement (probabilités)vignette|Jeu de dés : une expérience aléatoire. En théorie des probabilités, un événement lié à une expérience aléatoire est un sous-ensemble des résultats possibles pour cette expérience (c'est-à-dire un certain sous-ensemble de l'univers lié à l'expérience). Un événement étant souvent défini par une proposition, nous devons pouvoir dire, connaissant le résultat de l'expérience aléatoire, si l'événement a été réalisé ou non au cours de cette expérience. Par exemple, considérons l'expérience aléatoire consistant à lancer un dé à 6 faces.
Théorie des probabilitésLa théorie des probabilités en mathématiques est l'étude des phénomènes caractérisés par le hasard et l'incertitude. Elle forme avec la statistique les deux sciences du hasard qui sont partie intégrante des mathématiques. Les débuts de l'étude des probabilités correspondent aux premières observations du hasard dans les jeux ou dans les phénomènes climatiques par exemple. Bien que le calcul de probabilités sur des questions liées au hasard existe depuis longtemps, la formalisation mathématique n'est que récente.
Loi de probabilité à plusieurs variablesvignette|Représentation d'une loi normale multivariée. Les courbes rouge et bleue représentent les lois marginales. Les points noirs sont des réalisations de cette distribution à plusieurs variables. Dans certains problèmes interviennent simultanément plusieurs variables aléatoires. Mis à part les cas particuliers de variables indépendantes (notion définie ci-dessous) et de variables liées fonctionnellement, cela introduit la notion de loi de probabilité à plusieurs variables autrement appelée loi jointe.
Paradoxe d'Ellsbergvignette|Daniel Ellseberg, à l'origine du paradoxe, en 2006 Le paradoxe d'Ellsberg est un phénomène connu de la théorie de la décision. Lorsque des gens ont à choisir entre deux options, la majorité se décide pour celle dont la loi de probabilité est connue. Cela se trouve en contradiction avec le principe de la chose sûre de la théorie de la décision. Daniel Ellsberg a décrit l'expérience suivante en 1961 : Dans une urne, on place 90 boules, dont 30 sont rouges. Les boules restantes sont jaunes ou noires, leur distribution est inconnue.