Apprentissage par renforcementEn intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome ( robot, agent conversationnel, personnage dans un jeu vidéo), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps. L'agent est plongé au sein d'un environnement et prend ses décisions en fonction de son état courant. En retour, l'environnement procure à l'agent une récompense, qui peut être positive ou négative.
Politique monétaireLa politique monétaire est la politique publique menée par l'autorité monétaire (en général, la banque centrale). Elle a souvent vocation à assurer la stabilité des prix, le plein-emploi ou encore la stabilité du taux de change. La politique monétaire exploite un certain nombre de canaux de transmission tels que le taux d'intérêt, le taux de change ou les valeurs boursières. Elle se distingue de la politique budgétaire. Ces deux politiques interagissent et forment ensemble le policy-mix.