Apprentissage par renforcementEn intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome ( robot, agent conversationnel, personnage dans un jeu vidéo), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps. L'agent est plongé au sein d'un environnement et prend ses décisions en fonction de son état courant. En retour, l'environnement procure à l'agent une récompense, qui peut être positive ou négative.
D (langage)Le D est un langage de programmation impératif orienté objet et multi-paradigmes conçu pour la programmation système. Il s’inspire de nombreux langages, dont C++, Java (avec lequel il a en commun l'utilisation d'un ramasse-miettes et l'existence d'un héritage simple), Eiffel (pour le paradigme de programmation par contrat). D est en version 2.x, abrégé « D2 » (depuis le 17 juin 2007), et subit ponctuellement de légères modifications de spécification.
Bien publicEn économie, un bien public est un bien non rival ou non excluable. La consommation de ce bien par un agent n'affecte donc pas la quantité disponible pour les autres agents (non-rivalité). Il est impossible d'exclure un agent de l'utilisation de ce bien, même s'il n'a pas participé à son financement. Un bien public pur est un bien non rival et non excluable, il est impossible de faire payer l'accès à ce bien (non-excluabilité). Par exemple, une émission de radio est un bien public.