Apprentissage par renforcementEn intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome ( robot, agent conversationnel, personnage dans un jeu vidéo), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps. L'agent est plongé au sein d'un environnement et prend ses décisions en fonction de son état courant. En retour, l'environnement procure à l'agent une récompense, qui peut être positive ou négative.
D (langage)Le D est un langage de programmation impératif orienté objet et multi-paradigmes conçu pour la programmation système. Il s’inspire de nombreux langages, dont C++, Java (avec lequel il a en commun l'utilisation d'un ramasse-miettes et l'existence d'un héritage simple), Eiffel (pour le paradigme de programmation par contrat). D est en version 2.x, abrégé « D2 » (depuis le 17 juin 2007), et subit ponctuellement de légères modifications de spécification.
Bien publicEn économie, un bien public est un bien non rival ou non excluable. La consommation de ce bien par un agent n'affecte donc pas la quantité disponible pour les autres agents (non-rivalité). Il est impossible d'exclure un agent de l'utilisation de ce bien, même s'il n'a pas participé à son financement. Un bien public pur est un bien non rival et non excluable, il est impossible de faire payer l'accès à ce bien (non-excluabilité). Par exemple, une émission de radio est un bien public.
Qualité des donnéesLa qualité des données, en informatique se réfère à la conformité des données aux usages prévus, dans les modes opératoires, les processus, les prises de décision, et la planification (J.M. Juran). De même, les données sont jugées de grande qualité si elles représentent correctement la réalité à laquelle elles se réfèrent. Ces deux points de vue peuvent souvent entrer en contradiction, y compris lorsqu'un même ensemble de données est utilisé avec un objectif commun.
Théorie du contrôleEn mathématiques et en sciences de l'ingénieur, la théorie du contrôle a comme objet l'étude du comportement de systèmes dynamiques paramétrés en fonction des trajectoires de leurs paramètres. On se place dans un ensemble, l'espace d'état sur lequel on définit une dynamique, c'est-à-dire une loi mathématiques caractérisant l'évolution de variables (dites variables d'état) au sein de cet ensemble. Le déroulement du temps est modélisé par un entier .
Algorithme d'approximationEn informatique théorique, un algorithme d'approximation est une méthode permettant de calculer une solution approchée à un problème algorithmique d'optimisation. Plus précisément, c'est une heuristique garantissant à la qualité de la solution qui fournit un rapport inférieur (si l'on minimise) à une constante, par rapport à la qualité optimale d'une solution, pour toutes les instances possibles du problème.
Fonction objectifvignette|comparaison de certains substituts de la fonction de perte Le terme fonction objectif ou fonction économique, est utilisé en optimisation mathématique et en recherche opérationnelle pour désigner une fonction qui sert de critère pour déterminer la meilleure solution à un problème d'optimisation. Elle associe une valeur à une instance d'un problème d'optimisation. Le but du problème d'optimisation est alors de minimiser ou de maximiser cette fonction jusqu'à l'optimum, par différents procédés comme l'algorithme du simplexe.
Return statementIn computer programming, a return statement causes execution to leave the current subroutine and resume at the point in the code immediately after the instruction which called the subroutine, known as its return address. The return address is saved by the calling routine, today usually on the process's call stack or in a register. Return statements in many programming languages allow a function to specify a return value to be passed back to the code that called the function.
CapitalLe capital est une somme d'investissements utilisée pour en tirer un profit, c'est-à-dire un stock de biens ou de richesses nécessaires à une production. Cet emploi, courant en sciences économiques, en finance, en comptabilité, en sociologie et en philosophie, a néanmoins dans les domaines distincts des significations spécifiques. Au , « capital » est un adjectif dérivé de la racine latine caput : la tête, signifiant « principal ». Dans le dictionnaire de Nicot publié en 1606, l'adjectif est transformé en substantif pour désigner « le capital d'un marchand ».
Point (géométrie)thumb|Points dans un plan euclidien. En géométrie, un point est le plus petit élément constitutif de l'espace géométrique, c'est-à-dire un lieu au sein duquel on ne peut distinguer aucun autre lieu que lui-même. géométrie euclidienne Le point, selon Euclide, est . On peut aussi dire plus simplement qu'un point ne désigne pas un objet mais un emplacement. Il n'a donc aucune dimension, longueur, largeur, épaisseur, volume ou aire. Sa seule caractéristique est sa position. On dit parfois qu'il est « infiniment petit ».