Apprentissage par renforcementEn intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome ( robot, agent conversationnel, personnage dans un jeu vidéo), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps. L'agent est plongé au sein d'un environnement et prend ses décisions en fonction de son état courant. En retour, l'environnement procure à l'agent une récompense, qui peut être positive ou négative.
Robotvignette|Atlas (2013), robot androïde de Boston Dynamics vignette|Bras manipulateurs dans un laboratoire (2009) vignette|NAO (2006), robot humanoïde éducatif d'Aldebaran Robotics vignette|DER1 (2005), un actroïde d'accueil vignette|Roomba (2002), un robot ménager Un robot est un dispositif mécatronique (alliant mécanique, électronique et informatique) conçu pour accomplir automatiquement des tâches imitant ou reproduisant, dans un domaine précis, des actions humaines.
Robotiquethumb|upright=1.5|Nao, un robot humanoïde. thumb|upright=1.5|Des robots industriels au travail dans une usine. La robotique est l'ensemble des techniques permettant la conception et la réalisation de machines automatiques ou de robots. L'ATILF donne la définition suivante du robot : « il effectue, grâce à un système de commande automatique à base de microprocesseur, une tâche précise pour laquelle il a été conçu dans le domaine industriel, scientifique, militaire ou domestique ».
Robotique industriellevignette|droite|Un robot industriel Kawasaki FS-03N, robot de soudage La robotique industrielle est officiellement définie par l'Organisation Internationale de Normalisation (ISO) comme étant un système commandé automatiquement, multi-applicatif, reprogrammable, polyvalent, manipulateur et programmable sur trois axes ou plus. Les applications typiques incluent les robots de soudage, de peinture et d'assemblage. L'avantage de la robotique industrielle est sa rapidité d'exécution et sa précision ainsi que la répétition de cette précision dans le temps.
Téléopérationvignette|Un détonateur d'EEI contrôlé à distance, permettant de vérifier des engins potentiellement explosifs. La téléopération (ou opération à distance ) indique le contrôle d'un système ou d'une machine à distance. Son sens est similaire à celui de « télécommande », mais on le rencontre généralement dans les domaines de la recherche scientifique des techologies. Elle est fréquemment associée à la robotique et aux robots mobiles, mais peut être appliquée à toute une gamme de circonstances dans lesquelles un appareil ou une machine est actionné à distance par une personne.
Planification de mouvementLa planification de mouvement (en anglais motion planning) est un ensemble de techniques mathématiques et informatiques permettant de calculer des trajectoires pour un système cinématique, avec pour contrainte l'absence de collision. Il existe deux principales catégories de méthodes pour la planification de mouvement : La première est composée de méthodes dites déterministes, appelées ainsi car elles permettent de retrouver le même chemin à chaque exécution, sous réserve d'avoir des conditions initiales équivalentes.
Interface utilisateurL’interface utilisateur est un dispositif matériel ou logiciel qui permet à un usager d'interagir avec un produit informatique. C'est une interface informatique qui coordonne les interactions homme-machine, en permettant à l'usager humain de contrôler le produit et d'échanger des informations avec le produit. Parmi les exemples d’interface utilisateur figurent les aspects interactifs des systèmes d’exploitation informatiques, des logiciels informatiques, des smartphones et, dans le domaine du design industriel, les commandes des opérateurs de machines lourdes et les commandes de processus.
Apprentissage par renforcement profondL'apprentissage par renforcement profond (en anglais : deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais : machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais : deep learning). L'apprentissage par renforcement considère le problème d'un agent informatique (par exemple, un robot, un agent conversationnel, un personnage dans un jeu vidéo, etc.) qui apprend à prendre des décisions par essais et erreurs.
Robot domestiquethumb|Robot domestique nettoyant une vitre.|alt=le film montre un robot nettoyeur allant et venant sur une vitre de fenêtre en position verticale Un robot domestique est un robot de service personnel utilisé pour des tâches ménagères. On estime à le nombre de robots domestiques en 2006, avec une estimation de robots industriels. Les robots domestiques sont utilisés par exemple en vaisselle, en repassage, en nettoyage et en cuisine. Ils peuvent également être utilisés dans le domaine de la restauration et dans la construction.
Combat de robotsvignette|Deux robots en combat lors d'un événement RoboCore vignette|, deux fois champion du monde de Robot Wars Le combat de robots est un mode de compétition de robots dans lequel des machines construites sur mesure se battent en utilisant diverses méthodes pour se neutraliser mutuellement. Les machines sont généralement des véhicules télécommandés plutôt que des robots autonomes. Les compétitions de combat de robots ont fait l'objet de séries télévisées, notamment au Royaume-Uni et Battlebots : Le Choc des robots aux États-Unis.