Publication

What to Choose Next? A Paradigm for Testing Human Sequential Decision Making

Concepts associés (25)

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.

Connectez-vous pour utiliser Chat avec Graph Search

Heuristique de jugement

Les heuristiques de jugement, concept fréquemment employé dans le domaine de la cognition sociale, sont des opérations mentales automatiques, intuitives et rapides pouvant être statistiques ou non statistiques. Ces raccourcis cognitifs sont utilisés par les individus afin de simplifier leurs opérations mentales dans le but de répondre aux exigences de l’environnement. Par exemple, les gens ont tendance à estimer le temps mis pour trouver un emploi en fonction de la facilité avec laquelle ils peuvent penser à des individus qui ont récemment été engagés, et non selon le temps moyen de recherche dans la population.

Théorie du choix rationnel

La théorie du choix rationnel (en anglais « rational choice theory », prononcé 'ræʃənl tʃɔɪs thēərē), ou « décision rationnelle », en microéconomie contemporaine, regroupe plusieurs théories de l'action qui, de manière générale, attribuent aux agents un comportement rationnel, lequel, en raison de préférences, dénote une recherche du plus grand profit pour le moindre mal. Elles ont été développées en économie (où elles constituent un paradigme dominant), en sociologie (où elles sont en concurrence avec d'autres paradigmes) et en psychologie, notamment en criminologie.

Suite (mathématiques)

vignette|Exemple de suite : les points bleus représentent ses termes. En mathématiques, une suite est une famille d'éléments — appelés ses « termes » — indexée par les entiers naturels. Une suite finie est une famille indexée par les entiers strictement positifs inférieurs ou égaux à un certain entier, ce dernier étant appelé « longueur » de la suite. Lorsque tous les éléments d'une suite (infinie) appartiennent à un même ensemble , cette suite peut être assimilée à une application de dans .

Decision intelligence

Decision intelligence is an engineering discipline that augments data science with theory from social science, decision theory, and managerial science. Its application provides a framework for best practices in organizational decision-making and processes for applying machine learning at scale. The basic idea is that decisions are based on our understanding of how actions lead to outcomes. Decision intelligence is a discipline for analyzing this chain of cause and effect, and decision modeling is a visual language for representing these chains.

Espace séquentiel

En mathématiques, un espace séquentiel est un espace topologique dont la topologie est définie par l'ensemble de ses suites convergentes. C'est le cas en particulier pour tout espace à base dénombrable. Soit X un espace topologique. Un sous-ensemble U de X est dit « séquentiellement ouvert » si toute suite (xn) de X qui converge vers un point de U « appartient à U à partir d'un certain rang ». Un sous-ensemble F de X est dit « séquentiellement fermé » si la convergence d'une suite (xn) de F vers x implique que x appartient à F.

Q-learning

vignette|400x400px|Dans le Q-learning, l'agent exécute une action a en fonction de l'état s et d'une fonction Q. Il perçoit alors le nouvel état s' et une récompense r de l'environnement. Il met alors à jour la fonction Q. Le nouvel état s' devient alors l'état s, et l'apprentissage continue. En intelligence artificielle, plus précisément en apprentissage automatique, le Q-learning est un algorithme d'apprentissage par renforcement. Il ne nécessite aucun modèle initial de l'environnement.

Mathématiques discrètes

Les mathématiques discrètes, parfois appelées mathématiques finies, sont l'étude des structures mathématiques fondamentalement discrètes, par opposition aux structures continues. Contrairement aux nombres réels, qui ont la propriété de varier "en douceur", les objets étudiés en mathématiques discrètes (tels que les entiers relatifs, les graphes simples et les énoncés en logique) ne varient pas de cette façon, mais ont des valeurs distinctes séparées.

Incentive program

An incentive program is a formal scheme used to promote or encourage specific actions or behavior by a specific group of people during a defined period of time. Incentive programs are particularly used in business management to motivate employees and in sales to attract and retain customers. Scientific literature also refers to this concept as pay for performance. Motivation Employee incentive programs are programs used to increase overall employee performance.

Diagramme d'influence

Un diagramme d'influence (DI) (également appelé schéma de pertinence, diagramme de décision ou réseau de décision) est une représentation graphique et mathématique compacte d'une situation de décision. Il s'agit d'une généralisation d'un réseau bayésien, dans lequel non seulement les problèmes d'inférence probabiliste, mais aussi les problèmes de prise de décision (ex : critère d'utilité maximale attendue) peuvent être modélisés et résolus.

Bellman equation

A Bellman equation, named after Richard E. Bellman, is a necessary condition for optimality associated with the mathematical optimization method known as dynamic programming. It writes the "value" of a decision problem at a certain point in time in terms of the payoff from some initial choices and the "value" of the remaining decision problem that results from those initial choices. This breaks a dynamic optimization problem into a sequence of simpler subproblems, as Bellman's “principle of optimality" prescribes.