Publication

Ageing and reinforcement learning

Michael Herzog, Wei-Hsiang Lin
2021
Discussion par affiche
Résumé

Learning to achieve one’s goal in a complex environment is a complicated task. In reinforcement learning (RL) tasks, an agent interacts with the environment to learn optimal actions. In humans, striatal areas are strongly involved in these tasks. During aging, neurotransmitter levels in these regions decrease provoking the question of how RL changes. Here, we developed a RL paradigm comprised of several different states. For each state, there were four actions, which brought the participants to another state. The objective of the participants was to reach a pre-defined goal state as many times as possible in 8 (short inter-stimulus interval condition) and 40 (long inter-stimulus interval condition) minutes. We tested a cohort of 40 healthy older participants (mean age = 68.75 ± 8.24) and 30 healthy young adults (mean age = 25.03 ± 4.09). Young participants reached more goals and made more correct actions, within the given time limit, than the ageing cohort. In addition, older participants exhibited more perseverative behaviors, namely, they repeatedly performed specific state-action pairs regardless of the correctness. By applying a Q-learning model, we observed a significant difference between older and young people in the exploration rate but not in the learning rate and forgetting rate. From the computation model, we demonstrated that the deteriorated performance for ageing is due to the deficit in neither learning nor working memory but from more suboptimal judgments of the action selections. These results are in line with the studies that less responsiveness of the striatal areas leads to more perseverative actions.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
Concepts associés (34)
Q-learning
vignette|400x400px|Dans le Q-learning, l'agent exécute une action a en fonction de l'état s et d'une fonction Q. Il perçoit alors le nouvel état s' et une récompense r de l'environnement. Il met alors à jour la fonction Q. Le nouvel état s' devient alors l'état s, et l'apprentissage continue. En intelligence artificielle, plus précisément en apprentissage automatique, le Q-learning est un algorithme d'apprentissage par renforcement. Il ne nécessite aucun modèle initial de l'environnement.
Apprentissage par renforcement
En intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome ( robot, agent conversationnel, personnage dans un jeu vidéo), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps. L'agent est plongé au sein d'un environnement et prend ses décisions en fonction de son état courant. En retour, l'environnement procure à l'agent une récompense, qui peut être positive ou négative.
Striatum
thumb|260px|Vue en 3D du striatum (en rouge). En neuroanatomie, le striatum ou néostriatum, appelé également le corps strié est une structure nerveuse subcorticale (sous le cortex) paire. Il est impliqué dans le mouvement involontaire, la motivation alimentaire ou sexuelle, la gestion de la douleur (via le système dopaminergique) et la cicatrisation voire la régénérescence de certains tissus cérébraux. Il est lié aux maladies de Parkinson, de Huntington et de Gilles de la Tourette, ainsi qu'au phénomène d'addiction.
Afficher plus
Publications associées (46)

Multi-agent reinforcement learning with graph convolutional neural networks for optimal bidding strategies of generation units in electricity markets

Olga Fink, Mina Montazeri

Finding optimal bidding strategies for generation units in electricity markets would result in higher profit. However, it is a challenging problem due to the system uncertainty which is due to the lack of knowledge of the strategies of other generation uni ...
PERGAMON-ELSEVIER SCIENCE LTD2023

Multi-agent Reinforcement Learning for Assembly of a Spanning Structure

Gabriel Rémi Vallat

In this master thesis, multi-agent reinforcement learning is used to teach robots to build a self-supporting structure connecting two points. To accomplish this task, a physics simulator is first designed using linear programming. Then, the task of buildin ...
2023

Striatal Dopamine Signals and Reward Learning

Carl Petersen, Sylvain Crochet, Yanqi Liu, Parviz Ghaderi, Mauro Pulin, Anthony Pierre Robert Renard, Christos Sourmpis, Pol Bech Vilaseca, Meriam Malekzadeh, Robin François Virginien Dard

We are constantly bombarded by sensory information and constantly making decisions on how to act. In order to optimally adapt behavior, we must judge which sequences of sensory inputs and actions lead to successful outcomes in specific circumstances. Neuro ...
Oxford2023
Afficher plus
MOOCs associés (25)
Neuronal Dynamics - Computational Neuroscience of Single Neurons
The activity of neurons in the brain and the code used by these neurons is described by mathematical neuron models at different levels of detail.
Neuronal Dynamics - Computational Neuroscience of Single Neurons
The activity of neurons in the brain and the code used by these neurons is described by mathematical neuron models at different levels of detail.
Simulation Neurocience
Learn how to digitally reconstruct a single neuron to better study the biological mechanisms of brain function, behaviour and disease.
Afficher plus

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.