Temporal difference learningLe Temporal Difference (TD) learning est une classe d'algorithmes d'apprentissage par renforcement sans modèle. Ces algorithmes échantillonnent l'environnement de manière aléatoire à la manière des méthodes de Monte Carlo. Ils mettent à jour la politique (i.e. les actions à prendre dans chaque état) en se basant sur les estimations actuelles, comme les méthodes de programmation dynamique. Les méthodes TD ont un lien avec les modèles TD dans l'apprentissage animal. vignette|151x151px|Diagramme backup.
Prise de décision collectiveLa prise de décision collective (en anglais, collaborative decision making ou CDM) est une situation où des individus sont rassemblés en un groupe pour résoudre des problèmes. Selon l'idée de synergie, les décisions prises collectivement ont tendance à être plus efficaces que les décisions prises individuellement. Cependant, il existe des situations dans lesquelles les décisions prises en groupe aboutissent à un mauvais jugement. En psychologie sociale, la prise de décision collective peut être définie comme .
Observational learningObservational learning is learning that occurs through observing the behavior of others. It is a form of social learning which takes various forms, based on various processes. In humans, this form of learning seems to not need reinforcement to occur, but instead, requires a social model such as a parent, sibling, friend, or teacher with surroundings. Particularly in childhood, a model is someone of authority or higher status in an environment.
Réseau neuronal convolutifEn apprentissage automatique, un réseau de neurones convolutifs ou réseau de neurones à convolution (en anglais CNN ou ConvNet pour convolutional neural networks) est un type de réseau de neurones artificiels acycliques (feed-forward), dans lequel le motif de connexion entre les neurones est inspiré par le cortex visuel des animaux. Les neurones de cette région du cerveau sont arrangés de sorte qu'ils correspondent à des régions qui se chevauchent lors du pavage du champ visuel.
DOPALa 3,4-dihydroxyphénylalanine (abréviée en DOPA ou dopa) est une substance intermédiaire dans la synthèse des catécholamines. Elle possède deux isomères optiques, la L-DOPA ou L-dopa (ou , dénomination pharmacologique internationale), lévogyre, et la D-DOPA ou D-dopa, dextrogyre. La L-DOPA est la forme stéréo-isomérique lévogyre métabolisable par l'organisme. Sa décarboxylation par la DOPA-décarboxylase produit la dopamine. La L-DOPA est capable de franchir la barrière hémato-encéphalique.
NeurofeedbackLe neurofeedback est un type de biofeedback au cours duquel l'activité neuronale d’un individu est mesurée et lui est présentée en temps réel (sous différentes formes : son, image, etc.). Le but de cette méthode est que l’individu arrive à autoréguler son activité neuronale supposée sous-tendre un comportement ou une pathologie spécifique. De cette manière, avec le temps, le participant pourrait être capable d’apprendre comment contrôler volontairement l’activation de son cortex cérébral afin de réguler sa cognition et ses comportements dans la vie de tous les jours.
Behavioral addictionBehavioral addiction is a form of addiction that involves a compulsion to engage in a rewarding non-substance-related behavior – sometimes called a natural reward – despite any negative consequences to the person's physical, mental, social or financial well-being. Addiction canonically refers to substance abuse; however, the term's connotation has been expanded to include behaviors that may lead to a reward (such as gambling, eating, or shopping) since the 1990s.
Réseau de neurones à impulsionsLes réseaux de neurones à impulsions (SNNs : Spiking Neural Networks, en anglais) sont un raffinement des réseaux de neurones artificiels (ANNs : Artificial Neural Networks, en anglais) où l’échange entre neurones repose sur l’intégration des impulsions et la redescente de l’activation, à l’instar des neurones naturels. L’encodage est donc temporel et binaire. Le caractère binaire pose une difficulté de continuité au sens mathématique (cela empêche notamment l’utilisation des techniques de rétropropagation des coefficients - telle que la descente de gradient - utilisées classiquement dans les méthodes d'apprentissage).
Gamma waveA gamma wave or gamma rhythm is a pattern of neural oscillation in humans with a frequency between 25 and 140 Hz, the 40 Hz point being of particular interest. Gamma rhythms are correlated with large scale brain network activity and cognitive phenomena such as working memory, attention, and perceptual grouping, and can be increased in amplitude via meditation or neurostimulation. Altered gamma activity has been observed in many mood and cognitive disorders such as Alzheimer's disease, epilepsy, and schizophrenia.
Event-related potentialAn event-related potential (ERP) is the measured brain response that is the direct result of a specific sensory, cognitive, or motor event. More formally, it is any stereotyped electrophysiological response to a stimulus. The study of the brain in this way provides a noninvasive means of evaluating brain functioning. ERPs are measured by means of electroencephalography (EEG). The magnetoencephalography (MEG) equivalent of ERP is the ERF, or event-related field. Evoked potentials and induced potentials are subtypes of ERPs.