Réseau locomoteur spinalLe réseau locomoteur spinal, ou central pattern generator (CPG) en anglais, est un réseau de neurones localisé dans la moelle spinale responsable de la locomotion. La particularité de ce réseau est qu’il peut fonctionner de manière autonome, indépendamment des commandes descendantes et des retours sensoriels . Après avoir été activé par le cortex moteur ou d'autres régions supraspinales telles que la région mésencéphalique locomotrice (MLR en anglais), ce réseau peut générer à lui seul l’activité locomotrice.
Multi-agent reinforcement learningMulti-agent reinforcement learning (MARL) is a sub-field of reinforcement learning. It focuses on studying the behavior of multiple learning agents that coexist in a shared environment. Each agent is motivated by its own rewards, and does actions to advance its own interests; in some environments these interests are opposed to the interests of other agents, resulting in complex group dynamics. Multi-agent reinforcement learning is closely related to game theory and especially repeated games, as well as multi-agent systems.
Apprentissage par renforcementEn intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome ( robot, agent conversationnel, personnage dans un jeu vidéo), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps. L'agent est plongé au sein d'un environnement et prend ses décisions en fonction de son état courant. En retour, l'environnement procure à l'agent une récompense, qui peut être positive ou négative.
ProprioceptionLa proprioception (formé de proprio-, tiré du latin proprius, « propre », et de [ré]ception), ou sensibilité profonde, désigne la perception, consciente ou non, de la position des différentes parties du corps. Elle fonctionne grâce à de nombreux récepteurs musculaires et ligamentaires et aux voies et centres nerveux impliqués. La proprioception fait partie de la somesthésie. Le propriocepteur est le récepteur sensoriel qui assure la proprioception. La proprioception a été d'abord caractérisée chez les humains.
Apprentissage par renforcement profondL'apprentissage par renforcement profond (en anglais : deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais : machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais : deep learning). L'apprentissage par renforcement considère le problème d'un agent informatique (par exemple, un robot, un agent conversationnel, un personnage dans un jeu vidéo, etc.) qui apprend à prendre des décisions par essais et erreurs.
Reinforcement learning from human feedbackIn machine learning, reinforcement learning from human feedback (RLHF) or reinforcement learning from human preferences is a technique that trains a "reward model" directly from human feedback and uses the model as a reward function to optimize an agent's policy using reinforcement learning (RL) through an optimization algorithm like Proximal Policy Optimization. The reward model is trained in advance to the policy being optimized to predict if a given output is good (high reward) or bad (low reward).
OscillationUne oscillation est un mouvement ou une fluctuation périodique autour d'une position d'équilibre stable. Les oscillations sont soit régulières (périodiques) soit décroissantes (amorties). Elles répondent aux mêmes équations quel que soit le domaine. Une oscillation est une "variation d'une grandeur mécanique, électrique, caractérisée par un changement périodique de sens". Le cycle d'une oscillation est le temps écoulé entre deux passages successifs par la position d'équilibre.
Apprentissage profondL'apprentissage profond ou apprentissage en profondeur (en anglais : deep learning, deep structured learning, hierarchical learning) est un sous-domaine de l’intelligence artificielle qui utilise des réseaux neuronaux pour résoudre des tâches complexes grâce à des architectures articulées de différentes transformations non linéaires. Ces techniques ont permis des progrès importants et rapides dans les domaines de l'analyse du signal sonore ou visuel et notamment de la reconnaissance faciale, de la reconnaissance vocale, de la vision par ordinateur, du traitement automatisé du langage.
Q-learningvignette|400x400px|Dans le Q-learning, l'agent exécute une action a en fonction de l'état s et d'une fonction Q. Il perçoit alors le nouvel état s' et une récompense r de l'environnement. Il met alors à jour la fonction Q. Le nouvel état s' devient alors l'état s, et l'apprentissage continue. En intelligence artificielle, plus précisément en apprentissage automatique, le Q-learning est un algorithme d'apprentissage par renforcement. Il ne nécessite aucun modèle initial de l'environnement.
ÉquilibrioceptionL'équilibrioception, ou sens de l'équilibre, désigne un sens physiologique. Il aide à prévenir et à anticiper toute chute chez les humains et animaux lorsqu'ils sont en équilibre. L'équilibre est réalisé grâce à plusieurs fonctions : les yeux (perception visuelle), les oreilles (système vestibulaire) et les autres sens spatiaux (proprioception) qui ont idéalement besoin d'être intacts. Le système vestibulaire s'associe au système visuel pour percevoir si un objet est en mouvement.