Apprentissage par renforcement profondL'apprentissage par renforcement profond (en anglais : deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais : machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais : deep learning). L'apprentissage par renforcement considère le problème d'un agent informatique (par exemple, un robot, un agent conversationnel, un personnage dans un jeu vidéo, etc.) qui apprend à prendre des décisions par essais et erreurs.
Tumeur neuroendocrinienneLes tumeurs neuroendocriniennes ou tumeurs neuroendocrines (TNE) sont des tumeurs (néoplasmes) qui se forment à partir d'un développement désordonné de cellules du système endocrine (hormonal) et du système nerveux. Ces tumeurs particulières sont le plus souvent bénignes, mais quelques-unes sont malignes et peuvent facilement métastaser. La plupart se forment dans l'intestin et le poumon, mais on en trouve ailleurs dans le corps, sur les organes ayant des fonctions de glandes ou voisin ( pénis, voisin du testicule).
Cancer de la prostatevignette|Prostate et vésicules séminales (normales) Le cancer de la prostate est un cancer fréquent touchant la prostate, une glande de l'appareil reproducteur de l'homme. Le cancer se développe à partir des tissus de la prostate quand des cellules y mutent et se multiplient de façon incontrôlée. Celles-ci peuvent ensuite s'étendre (se métastaser) en migrant de la prostate jusqu'à d'autres parties du corps, particulièrement les os et les ganglions lymphatiques du pelvis.
Attention (machine learning)Machine learning-based attention is a mechanism mimicking cognitive attention. It calculates "soft" weights for each word, more precisely for its embedding, in the context window. It can do it either in parallel (such as in transformers) or sequentially (such as recursive neural networks). "Soft" weights can change during each runtime, in contrast to "hard" weights, which are (pre-)trained and fine-tuned and remain frozen afterwards. Multiple attention heads are used in transformer-based large language models.
Apprentissage par renforcementEn intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome ( robot, agent conversationnel, personnage dans un jeu vidéo), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps. L'agent est plongé au sein d'un environnement et prend ses décisions en fonction de son état courant. En retour, l'environnement procure à l'agent une récompense, qui peut être positive ou négative.
Somatic mutationA somatic mutation is a change in the DNA sequence of a somatic cell of a multicellular organism with dedicated reproductive cells; that is, any mutation that occurs in a cell other than a gamete, germ cell, or gametocyte. Unlike germline mutations, which can be passed on to the descendants of an organism, somatic mutations are not usually transmitted to descendants. This distinction is blurred in plants, which lack a dedicated germline, and in those animals that can reproduce asexually through mechanisms such as budding, as in members of the cnidarian genus Hydra.
Mutation ponctuelle500px|aucun|droite Une mutation ponctuelle est un changement de la structure du gène, affectant un à plusieurs nucléotides (entre un et dix). Il existe quatre types de mutations ponctuelles : mutation par substitution : remplacement d’un (ou plusieurs) nucléotides par un autre (ou plusieurs autres) ; mutation par insertion : ajout d’un ou plusieurs nucléotides ; mutation par délétion : perte d'un ou plusieurs nucléotides.
Médecine personnaliséeLa médecine personnalisée est une médecine cherchant à améliorer la stratification et la prise en charge des patients en utilisant des informations biologiques et des biomarqueurs au niveau des voies moléculaires des maladies, de la génétique, de la protéomique ainsi que de la métabolomique. La définition de la médecine personnalisée n’a pas été véritablement établie et est parfois floue.
Treatment of cancerCancer can be treated by surgery, chemotherapy, radiation therapy, hormonal therapy, targeted therapy (including immunotherapy such as monoclonal antibody therapy) and synthetic lethality, most commonly as a series of separate treatments (e.g. chemotherapy before surgery). The choice of therapy depends upon the location and grade of the tumor and the stage of the disease, as well as the general state of the patient (performance status). Cancer genome sequencing helps in determining which cancer the patient exactly has for determining the best therapy for the cancer.
Q-learningvignette|400x400px|Dans le Q-learning, l'agent exécute une action a en fonction de l'état s et d'une fonction Q. Il perçoit alors le nouvel état s' et une récompense r de l'environnement. Il met alors à jour la fonction Q. Le nouvel état s' devient alors l'état s, et l'apprentissage continue. En intelligence artificielle, plus précisément en apprentissage automatique, le Q-learning est un algorithme d'apprentissage par renforcement. Il ne nécessite aucun modèle initial de l'environnement.