DopamineLa dopamine (DA) est un neurotransmetteur, une molécule biochimique qui permet la communication au sein du système nerveux, et l'une de celles qui influent directement sur le comportement. La dopamine renforce les actions habituellement bénéfiques telles que manger un aliment sain en provoquant la sensation de plaisir ce qui active ainsi le système de récompense/renforcement. Elle est donc indispensable à la survie de l'individu. Plus généralement, elle joue un rôle dans la motivation et la prise de risque chez les mammifères, donc chez l'être humain aussi.
Récepteur dopaminergiquevignette|Il s'agit d'une illustration d'un neurone dopaminergique avec TAAR1 co-localisé et les effets d'un agoniste TAAR1 (amphétamine ou une amine trace) sur la recapture et l'efflux de dopamine. Ce modèle est basé sur des informations provenant des trois sources suivantes : Offermanns, Stefan ; (eds.), Walter Rosenthal (2008). Encyclopédie de la pharmacologie moléculaire (2e éd.). Berlin : Springer. pp. 1219-1222. . Miller GM (janvier 2011).
Agoniste de la dopamineUn agoniste des récepteurs de la dopamine est un composé qui active les récepteurs de la dopamine. Les agonistes des récepteurs de la dopamine activent les voies de signalisation via les protéines G trimères et les β-arrestines, ce qui entraîne des modifications de la transcription des gènes. On connaît aujourd'hui plusieurs agonistes des récepteurs de la dopamine (D1, D2, D3), qui traitent ces voies de signalisation de manière différentielle. On les appelle des agonistes biaisés.
Apprentissage par renforcementEn intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome ( robot, agent conversationnel, personnage dans un jeu vidéo), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps. L'agent est plongé au sein d'un environnement et prend ses décisions en fonction de son état courant. En retour, l'environnement procure à l'agent une récompense, qui peut être positive ou négative.
Apprentissage par renforcement profondL'apprentissage par renforcement profond (en anglais : deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais : machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais : deep learning). L'apprentissage par renforcement considère le problème d'un agent informatique (par exemple, un robot, un agent conversationnel, un personnage dans un jeu vidéo, etc.) qui apprend à prendre des décisions par essais et erreurs.
Neural networkA neural network can refer to a neural circuit of biological neurons (sometimes also called a biological neural network), a network of artificial neurons or nodes in the case of an artificial neural network. Artificial neural networks are used for solving artificial intelligence (AI) problems; they model connections of biological neurons as weights between nodes. A positive weight reflects an excitatory connection, while negative values mean inhibitory connections. All inputs are modified by a weight and summed.
Q-learningvignette|400x400px|Dans le Q-learning, l'agent exécute une action a en fonction de l'état s et d'une fonction Q. Il perçoit alors le nouvel état s' et une récompense r de l'environnement. Il met alors à jour la fonction Q. Le nouvel état s' devient alors l'état s, et l'apprentissage continue. En intelligence artificielle, plus précisément en apprentissage automatique, le Q-learning est un algorithme d'apprentissage par renforcement. Il ne nécessite aucun modèle initial de l'environnement.
Émotionthumb|upright=1.8|Roue des émotions de Robert Plutchik.|alt= L'émotion est une expérience psychophysiologique complexe et intense (avec un début brutal et une durée relativement brève) de l'état d'esprit d'un individu animal liée à un objet repérable lorsqu'il réagit aux influences biochimiques (internes) et environnementales (externes). Chez les humains, l'émotion inclut fondamentalement « un comportement physiologique, des comportements expressifs et une conscience ».
Aversion pour la pertevignette|Graphique de la valeur perçue du gain et de la perte par rapport à la valeur numérique stricte du gain et de la perte : Une perte de 0,05 estperc\cuecommeuneperted′utiliteˊbeaucoupplusimportantequel′augmentationd′utiliteˊd′ungainde0,05. L'aversion pour la perte est une notion issue de l'économie comportementale, elle est un biais comportemental qui fait que les humains attachent plus d'importance à une perte qu'à un gain du même montant. RenforcementEn psychologie, le renforcement est un procédé qui augmente la probabilité de répétition d'un comportement. Les théories sur l'apprentissage par renforcement sont étudiées par la psychologie béhavioriste et font l'objet de nombreuses applications visant à modifier les comportements animaux et humains. B.F. Skinner fut le premier à en étudier systématiquement les effets sur des rats et des pigeons. Le renforcement est une procédure par laquelle la fréquence d'apparition d'un comportement va augmenter en fonction de sa conséquence.