Cancer de la peauLes cancers de la peau sont des tumeurs malignes d'histologie variée, développées aux dépens des cellules de la peau. On distingue principalement : les épithéliomes, dérivant du tissu épithélial, eux-mêmes composés de deux grands groupes de carcinomes : le carcinome basocellulaire et le carcinome spinocellulaire ; les mélanomes, développés à partir des cellules næviques, qui peuvent résulter de la transformation d'un nævus ou se développer de novo ; et les sarcomes, développés à partir du tissu conjonctif.
Cancer du seinLe 'cancer du sein' est un cancer de la glande mammaire. Autrement dit, c'est un cancer qui naît dans les unités cellulaires dont la fonction est de sécréter le lait, les unités ducto-lobulaires du sein, essentiellement chez la femme. Huit cancers du sein sur dix se déclarent après 50 ans. Premier cancer dans le monde, il touche, en 2016, 1,8 million de femmes par an dans le monde, dont en France. On s'attend à ce qu'une femme sur huit reçoive un diagnostic de cancer du sein au cours de sa vie.
CancerLe cancer est une maladie provoquée par la transformation de cellules qui deviennent anormales et prolifèrent de façon excessive. Ces cellules déréglées finissent parfois par former une masse qu'on appelle tumeur maligne. Les cellules cancéreuses ont tendance à envahir les tissus voisins et à se détacher de la tumeur initiale. Elles migrent alors par les vaisseaux sanguins et les vaisseaux lymphatiques pour aller former une autre tumeur (métastase).
Q-learningvignette|400x400px|Dans le Q-learning, l'agent exécute une action a en fonction de l'état s et d'une fonction Q. Il perçoit alors le nouvel état s' et une récompense r de l'environnement. Il met alors à jour la fonction Q. Le nouvel état s' devient alors l'état s, et l'apprentissage continue. En intelligence artificielle, plus précisément en apprentissage automatique, le Q-learning est un algorithme d'apprentissage par renforcement. Il ne nécessite aucun modèle initial de l'environnement.
Apprentissage par renforcement profondL'apprentissage par renforcement profond (en anglais : deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais : machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais : deep learning). L'apprentissage par renforcement considère le problème d'un agent informatique (par exemple, un robot, un agent conversationnel, un personnage dans un jeu vidéo, etc.) qui apprend à prendre des décisions par essais et erreurs.