Apprentissage par renforcement profondL'apprentissage par renforcement profond (en anglais : deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais : machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais : deep learning). L'apprentissage par renforcement considère le problème d'un agent informatique (par exemple, un robot, un agent conversationnel, un personnage dans un jeu vidéo, etc.) qui apprend à prendre des décisions par essais et erreurs.
Classification en classes multiplesIn machine learning and statistical classification, multiclass classification or multinomial classification is the problem of classifying instances into one of three or more classes (classifying instances into one of two classes is called binary classification). While many classification algorithms (notably multinomial logistic regression) naturally permit the use of more than two classes, some are by nature binary algorithms; these can, however, be turned into multinomial classifiers by a variety of strategies.
Lobe frontalLe lobe frontal est une région du cerveau des vertébrés. Il est situé à l'avant des lobes pariétal et temporal. Dans le cerveau humain, le sillon central (ou scissure de Rolando) sépare le lobe frontal du lobe pariétal tout au long de la surface du cortex cérébral. Le sillon latéral (ou scissure de Sylvius) sépare le gyrus (ou circonvolution) frontal inférieur du lobe temporal.
Gyrus frontal supérieurLe gyrus frontal supérieur F est un gyrus du lobe frontal du cortex cérébral, situé sur la convexité hémisphérique et limité en bas par le sillon frontal supérieur. Ce gyrus comporte deux segments : un segment supérieur ou dorsal qui longe le bord supérieur de l'hémisphère, limité en dedans par le sillon cingulaire et en dehors par le sillon frontal supérieur. Il est donc à cheval sur le bord de l'hémisphère, avec une partie sur la face interne et une autre sur la face externe.
Partitionnement de donnéesvignette|upright=1.2|Exemple de clustering hiérarchique. Le partitionnement de données (ou data clustering en anglais) est une méthode en analyse des données. Elle vise à diviser un ensemble de données en différents « paquets » homogènes, en ce sens que les données de chaque sous-ensemble partagent des caractéristiques communes, qui correspondent le plus souvent à des critères de proximité (similarité informatique) que l'on définit en introduisant des mesures et classes de distance entre objets.
Système multi-agentsEn informatique, un système multi-agent (SMA) est un système composé d'un ensemble d'agents (un processus, un robot, un être humain, une fourmi etc.), actifs dans un certain environnement et interagissant selon certaines règles. Un agent est une entité caractérisée par le fait qu'elle est, au moins partiellement, autonome, ce qui exclut un pilotage centralisé du système global.
Cortex préfrontalLe cortex préfrontal est la partie antérieure du cortex du lobe frontal du cerveau, située en avant des régions prémotrices. Cette région est le siège de différentes fonctions cognitives dites supérieures (notamment le langage, la mémoire de travail, le raisonnement, et plus généralement les fonctions exécutives). C'est aussi la région du goût et de l'odorat. Il existe trois possibilités pour définir le cortex préfrontal : le cortex frontal possédant une couche IV granulaire ; la zone de projection du noyau médiodorsal du thalamus ; la zone du cortex frontal dont la stimulation n'évoque aucun mouvement.
Rétroactionvignette|Représentation d'une boucle de rétroaction. La rétroaction (en anglais feedback) est un processus dans lequel un effet intervient aussi comme agent causal sur sa propre origine, la séquence des expressions de la cause principale et des effets successifs formant une boucle de rétroaction. Une rétroaction est une interaction dans laquelle la perturbation d’une variable provoque le changement d'une seconde variable, qui influe à son tour sur la variable initiale. Une rétroaction forme une boucle fermée dans un diagramme de causalité.
Hallucination (intelligence artificielle)Dans le domaine de l’intelligence artificielle, une hallucination est une réponse manifestement fausse qui est présentée comme un fait certain. Par exemple, un chatbot qui invente un chiffre d’affaires pour une entreprise sans avoir de données à ce sujet. Ce phénomène est appelé « hallucination » par analogie avec le phénomène de l’hallucination en psychologie humaine. Le terme hallucination en intelligence artificielle a pris de l'importance vers 2022 parallèlement au déploiement des modèles de langage basés sur l'apprentissage profond tels que ChatGPT.
Contre-réactionvignette|Modèle simple de contre-réaction. En électronique le principe de la contre-réaction permet le contrôle des circuits d', de filtrage ou d'asservissement. Elle permet de rendre leurs caractéristiques de fonctionnement indépendantes, dans une large mesure, des différents constituants internes de ces systèmes. Le principe de la contre-réaction a été découvert par Harold Stephen Black le 2 août 1927. Cette idée lui serait venue alors qu'il se rendait à son travail aux laboratoires Bell.