Apprentissage par renforcement profondL'apprentissage par renforcement profond (en anglais : deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais : machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais : deep learning). L'apprentissage par renforcement considère le problème d'un agent informatique (par exemple, un robot, un agent conversationnel, un personnage dans un jeu vidéo, etc.) qui apprend à prendre des décisions par essais et erreurs.
Chambre à filsUne chambre à fils (ou plus précisément chambre proportionnelle multifilaire) est un détecteur de particules ionisées inventé en 1968 par Georges Charpak, ce qui lui vaut le prix Nobel de physique en 1992. Ce détecteur a rapidement remplacé la chambre à bulles qui nécessitait de photographier la trajectoire des particules et manquait de précision. Avec une chambre à fils, un traitement informatique des données est rendu possible, permettant ainsi de déterminer avec précision la trajectoire des particules qui la traversent.
Q-learningvignette|400x400px|Dans le Q-learning, l'agent exécute une action a en fonction de l'état s et d'une fonction Q. Il perçoit alors le nouvel état s' et une récompense r de l'environnement. Il met alors à jour la fonction Q. Le nouvel état s' devient alors l'état s, et l'apprentissage continue. En intelligence artificielle, plus précisément en apprentissage automatique, le Q-learning est un algorithme d'apprentissage par renforcement. Il ne nécessite aucun modèle initial de l'environnement.
Apprentissage par renforcementEn intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome ( robot, agent conversationnel, personnage dans un jeu vidéo), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps. L'agent est plongé au sein d'un environnement et prend ses décisions en fonction de son état courant. En retour, l'environnement procure à l'agent une récompense, qui peut être positive ou négative.
Explainable artificial intelligenceExplainable AI (XAI), also known as Interpretable AI, or Explainable Machine Learning (XML), either refers to an AI system over which it is possible for humans to retain intellectual oversight, or to the methods to achieve this. The main focus is usually on the reasoning behind the decisions or predictions made by the AI which are made more understandable and transparent. XAI counters the "black box" tendency of machine learning, where even the AI's designers cannot explain why it arrived at a specific decision.
Réseaux antagonistes génératifsEn intelligence artificielle, les réseaux antagonistes génératifs (RAG) parfois aussi appelés réseaux adverses génératifs (en anglais generative adversarial networks ou GANs) sont une classe d'algorithmes d'apprentissage non supervisé. Ces algorithmes ont été introduits par . Ils permettent de générer des images avec un fort degré de réalisme. Un GAN est un modèle génératif où deux réseaux sont placés en compétition dans un scénario de théorie des jeux. Le premier réseau est le générateur, il génère un échantillon (ex.
Particle identificationParticle identification is the process of using information left by a particle passing through a particle detector to identify the type of particle. Particle identification reduces backgrounds and improves measurement resolutions, and is essential to many analyses at particle detectors. Charged particles have been identified using a variety of techniques. All methods rely on a measurement of the momentum in a tracking chamber combined with a measurement of the velocity to determine the charged particle mass, and therefore its identity.
ProtonLe proton est une particule subatomique portant une charge électrique élémentaire positive. Les protons sont présents dans les noyaux atomiques, généralement liés à des neutrons par l'interaction forte (la seule exception, mais celle du nucléide le plus abondant de l'univers, est le noyau d'hydrogène ordinaire (protiumH), un simple proton). Le nombre de protons d'un noyau est représenté par son numéro atomique Z. Le proton n'est pas une particule élémentaire mais une particule composite.
Particule αLes particules alpha (ou rayons alpha) sont une forme de rayonnement émis, principalement, par des noyaux instables de grande masse atomique. Elles sont constituées de deux protons et deux neutrons combinés en une particule identique au noyau d' (hélion) ; elles peuvent donc s'écrire 4He2+. La masse d'une particule alpha est de , ce qui équivaut à une énergie de masse de . Radioactivité α Les particules alpha sont émises par des noyaux radioactifs, comme l'uranium ou le radium, par l'intermédiaire du processus de désintégration alpha.
Learning rateIn machine learning and statistics, the learning rate is a tuning parameter in an optimization algorithm that determines the step size at each iteration while moving toward a minimum of a loss function. Since it influences to what extent newly acquired information overrides old information, it metaphorically represents the speed at which a machine learning model "learns". In the adaptive control literature, the learning rate is commonly referred to as gain. In setting a learning rate, there is a trade-off between the rate of convergence and overshooting.