ComportementLe terme « comportement » désigne les actions d'un être vivant. Il a été introduit en psychologie française en 1908 par Henri Piéron comme équivalent français de l'anglais-américain behavior. On l'utilise notamment en éthologie (humaine et animale) ou en psychologie expérimentale. Il peut aussi être pris comme équivalent de conduite dans l'approche psychanalytique. Le comportement d'un être vivant est la partie de son activité qui se manifeste à un observateur.
Conditionnement classiquevignette|thumbtime=192|L'expérience du petit Albert. Le conditionnement classique (aussi appelé conditionnement répondant, conditionnement de type I ou conditionnement pavlovien) est proposé par Ivan Pavlov en 1903. La publication de son livre « Conditioned Reflexes: an Investigation of the Psysiological Activity of the Cerebral Cortex » en 1927 a laissé un impact majeur sur le développement de la psychologie. Cette théorie s'intéresse aux résultats d'un apprentissage dû à l'association entre des stimuli de l'environnement et les réactions inconditionnelles de l'organisme.
Comportement humainvignette| Les Homo Sapiens (humains) affichent souvent différents types de comportement. Le comportement humain est la capacité potentielle et exprimée (mentalement, physiquement et socialement) d'individus ou de groupes humains à répondre à des stimuli internes et externes tout au long de leur vie. Alors que les traits spécifiques de la personnalité, du tempérament et de la génétique peuvent rester stables, d'autres comportements changent à mesure que l'on passe entre les étapes de la vie, c'est-à-dire de la naissance à l'adolescence, à l'âge adulte et, par exemple, à la parentalité et à la retraite.
Conditionnement opérantLe conditionnement opérant (appelé aussi conditionnement instrumental, apprentissage skinnerien ou conditionnement de type II) est un concept du béhaviorisme initié par Edward Thorndike et développé par Burrhus Frederic Skinner au milieu du . Cette théorie s'intéresse à l'apprentissage dont résulte une action et tient compte de conséquences de cette dernière rendant plus ou moins probable la reproduction dudit comportement.
Q-learningvignette|400x400px|Dans le Q-learning, l'agent exécute une action a en fonction de l'état s et d'une fonction Q. Il perçoit alors le nouvel état s' et une récompense r de l'environnement. Il met alors à jour la fonction Q. Le nouvel état s' devient alors l'état s, et l'apprentissage continue. En intelligence artificielle, plus précisément en apprentissage automatique, le Q-learning est un algorithme d'apprentissage par renforcement. Il ne nécessite aucun modèle initial de l'environnement.
RenforcementEn psychologie, le renforcement est un procédé qui augmente la probabilité de répétition d'un comportement. Les théories sur l'apprentissage par renforcement sont étudiées par la psychologie béhavioriste et font l'objet de nombreuses applications visant à modifier les comportements animaux et humains. B.F. Skinner fut le premier à en étudier systématiquement les effets sur des rats et des pigeons. Le renforcement est une procédure par laquelle la fréquence d'apparition d'un comportement va augmenter en fonction de sa conséquence.
Apprentissage par renforcementEn intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome ( robot, agent conversationnel, personnage dans un jeu vidéo), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps. L'agent est plongé au sein d'un environnement et prend ses décisions en fonction de son état courant. En retour, l'environnement procure à l'agent une récompense, qui peut être positive ou négative.
DomptageLe domptage se réfère aux réponses spécifiques d'animaux sauvages entraînés à l'obéissance humaine. Il sert, en règle générale, à des actes notamment protecteurs ou de divertissement. Le dompteur d'animaux est la personne qui présente dans un cirque des fauves dressés à exécuter quelques tours. Ce terme doit être différencié du terme de dresseur ou éducateur d'animaux qui concerne des animaux domestiques. Les souffrances liées au domptage constituent l'un des arguments de l'opposition à l'utilisation d'animaux sauvages dans les cirques.
Intelligence animalethumb|right|300px|Une comparaison du cerveau de différents mammifères. « Intelligence animale » est une expression renvoyant aux capacités cognitives des animaux et à leur étude. Le sujet a donné lieu à de nombreux travaux dont les résultats offrent non seulement une meilleure compréhension du monde animal mais aussi, par extension, des pistes pour l’étude de l'intelligence humaine. Différents groupes d'espèces se démarquent par leurs aptitudes intellectuelles lors des recherches sur l'éthologie cognitive.
Apprentissage par renforcement profondL'apprentissage par renforcement profond (en anglais : deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais : machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais : deep learning). L'apprentissage par renforcement considère le problème d'un agent informatique (par exemple, un robot, un agent conversationnel, un personnage dans un jeu vidéo, etc.) qui apprend à prendre des décisions par essais et erreurs.