Apprentissage par renforcementEn intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome ( robot, agent conversationnel, personnage dans un jeu vidéo), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps. L'agent est plongé au sein d'un environnement et prend ses décisions en fonction de son état courant. En retour, l'environnement procure à l'agent une récompense, qui peut être positive ou négative.
Processus de décision markovienEn théorie de la décision et de la théorie des probabilités, un processus de décision markovien (en anglais Markov decision process, MDP) est un modèle stochastique où un agent prend des décisions et où les résultats de ses actions sont aléatoires. Les MDPs sont utilisés pour étudier des problèmes d'optimisation à l'aide d'algorithmes de programmation dynamique ou d'apprentissage par renforcement. Les MDPs sont connus depuis les années 1950. Une grande contribution provient du travail de Ronald A.
Algorithme d'apprentissage incrémentalEn informatique, un algorithme d'apprentissage incrémental ou incrémentiel est un algorithme d'apprentissage qui a la particularité d'être online, c'est-à-dire qui apprend à partir de données reçues au fur et à mesure du temps. À chaque incrément il reçoit des données d'entrées et un résultat, l'algorithme calcule alors une amélioration du calcul fait pour prédire le résultat à partir des données d'entrées.
Stability (learning theory)Stability, also known as algorithmic stability, is a notion in computational learning theory of how a machine learning algorithm output is changed with small perturbations to its inputs. A stable learning algorithm is one for which the prediction does not change much when the training data is modified slightly. For instance, consider a machine learning algorithm that is being trained to recognize handwritten letters of the alphabet, using 1000 examples of handwritten letters and their labels ("A" to "Z") as a training set.
GouvernanceLa gouvernance est, de façon générale, un concept représentant la manière dont un domaine d’activités est gouverné. La gouvernance renvoie à un système d’entités décisionnelles qui dirige un certain domaine d’activités, autrement dit à un « système de gouvernance », impliquant notamment une structure de gouvernance et un dynamisme de système (processus de gouvernance, activités de gestion, etc). Parmi les types de gouvernance, on retrouve la gouvernance publique et la gouvernance privée.
Gouvernement d'entreprisevignette|Exemple de Système Gouvernance par les documents Le gouvernement d'entreprise (ou gouvernance d'entreprise - expression dérivée de l'anglais « corporate governance » -) désigne l'ensemble des processus, réglementations, lois et institutions destinés à cadrer la manière dont l'entreprise est dirigée, administrée et contrôlée. Dans le modèle le plus courant du capitaliste moderne, le gouvernement d'entreprise est pensé pour maximiser les intérêts des actionnaires (montant des dividendes et valeur des parts sociales et des actions).
Apprentissage par renforcement profondL'apprentissage par renforcement profond (en anglais : deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais : machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais : deep learning). L'apprentissage par renforcement considère le problème d'un agent informatique (par exemple, un robot, un agent conversationnel, un personnage dans un jeu vidéo, etc.) qui apprend à prendre des décisions par essais et erreurs.
Inégalité socialeUne inégalité sociale, est une différence dans l’accès à des ressources sociales rares et valorisées, ressources étant entendu au sens le plus large, incluant toutes les possibilités d'actions humaines : politique, économique, culturelle, sociale, sexuelle, etc.. Les inégalités sociales sont donc le résultat d'une distribution inégale des ressources au sein d’une société. Les inégalités sont au fondement de la stratification des sociétés humaines. En effet, l'accès inégal aux ressources socialement valorisées distribue les individus en différents groupes sociaux.
Justice socialeLa justice sociale est une construction morale et politique qui vise à l'égalité des droits et conçoit la nécessité d'une solidarité collective entre les personnes d'une société donnée. L'entrée correspondant à ce terme dans le Dictionnaire des sciences économiques et sociales le fait reposer théoriquement sur deux principes. Soit, un premier principe d'équité, avec lequel il ne faut pas confondre celui de justice, et qui s'entend plutôt comme le principe du « à chacun son dû ».
Psychologie positiveLa psychologie positive est une discipline de la psychologie fondée officiellement en 1998 lors du congrès annuel de l'Association américaine de psychologie par son président de l'époque, Martin E. P. Seligman ( son discours publié en 1999 dans le journal de l'APA, The American Psychologist). Cependant, la psychologie positive a des racines plus anciennes. La psychologie positive ne doit pas être confondue avec la pensée positive, une pseudo-science basée sur l'autosuggestion, faisant l'objet de nombreux best-sellers vendus à des millions d'exemplaires à travers le monde depuis les années 1950.