Jeux d'entrainement, de validation et de testEn apprentissage automatique, une tâche courante est l'étude et la construction d'algorithmes qui peuvent apprendre et faire des prédictions sur les données. De tels algorithmes fonctionnent en faisant des prédictions ou des décisions basées sur les données, en construisant un modèle mathématique à partir des données d'entrée. Ces données d'entrée utilisées pour construire le modèle sont généralement divisées en plusieurs jeux de données .
Cancer des voies aérodigestives supérieuresUn cancer des voies aérodigestives supérieures (ou improprement cancer de la tête et du cou) est un cancer localisé au niveau des voies aérodigestives supérieures, ce qui regroupe les sinus, les fosses nasales, le pharynx (composé du nasopharynx, de l'oropharynx et de l'hypopharynx), la cavité buccale et le larynx. Outre la localisation, ce type de cancer partage, pour un certain nombre, plusieurs éléments : survenue liée à la consommation importante d'alcool et de tabac, type histologique de carcinome épidermoïde, exploration médicale ORL stéréotypée.
Cancer colorectalLe cancer colorectal (ou colo-rectal) est une tumeur maligne de la muqueuse du côlon ou du rectum. Il peut toucher tous les segments anatomiques du gros intestin comme le caecum, le côlon ascendant, le côlon transverse, le côlon descendant, le côlon sigmoïde et le rectum mais ne concerne pas le cancer du canal anal qui est une entité distincte. Le type histologique est un adénocarcinome lieberkühnien dans la majorité des cas. Les symptômes de la maladie dépendent de l'emplacement de la tumeur et de son stade.
Cancer du poumonvignette|upright=1|Représentation en coupe tridimensionnelle par tomodensitométrie d'un poumon présentant une tumeur. vignette|upright=1|Radiographie de face du thorax montrant un probable cancer du poumon (taches claires sur le côté externe de chaque poumon). Les expressions cancer du poumon et cancer bronchique désignent au sens strict une tumeur maligne du poumon, et par extension les carcinomes pulmonaires, qui regroupent les tumeurs malignes épithéliales du poumon.
Validation croiséeLa validation croisée () est, en apprentissage automatique, une méthode d’estimation de fiabilité d’un modèle fondée sur une technique d’échantillonnage. Supposons posséder un modèle statistique avec un ou plusieurs paramètres inconnus, et un ensemble de données d'apprentissage sur lequel on peut apprendre (ou « entraîner ») le modèle. Le processus d'apprentissage optimise les paramètres du modèle afin que celui-ci corresponde le mieux possible aux données d'apprentissage.
GénomiqueLa génomique est une discipline de la biologie moderne. Elle étudie le fonctionnement d'un organisme, d'un organe, d'un cancer, etc. à l'échelle du génome, au lieu de se limiter à l'échelle d'un seul gène. La génomique se divise en deux branches : La génomique structurale, qui se charge du séquençage du génome entier ; La génomique fonctionnelle, qui vise à déterminer la fonction et l'expression des gènes séquencés en caractérisant le transcriptome et le protéome. La génomique est l'équivalent de la métabolomique pour les métabolites.
Microbiomevignette|upright=2|Phytobiome (ou microbiome d'un végétal) occupant l'endosphère (toute la plante) et ici aussi représenté compartimenté, dont en rhizosphère (sur et à proximité des racines), et phyllosphère (sur et sous les feuilles uniquement). On retrouve aussi sur (voire dans) la plante des microbes plus ou moins ubiquistes et opportunistes, éventuellement pathogènes provenant de l'air et du sol.
Esophageal webEsophageal webs are thin membranes occurring anywhere along the esophagus. Its main symptoms are pain and difficulty in swallowing (dysphagia). Esophageal webs are thin membranes of normal esophageal tissue consisting of mucosa and submucosa that can partially protrude/obstruct the esophagus. They can be congenital or acquired. Congenital webs commonly appear in the middle and inferior third of the esophagus, and they are more likely to be circumferential with a central or eccentric orifice.
Regression validationIn statistics, regression validation is the process of deciding whether the numerical results quantifying hypothesized relationships between variables, obtained from regression analysis, are acceptable as descriptions of the data. The validation process can involve analyzing the goodness of fit of the regression, analyzing whether the regression residuals are random, and checking whether the model's predictive performance deteriorates substantially when applied to data that were not used in model estimation.
MétabolismeLe métabolisme est l'ensemble des réactions chimiques qui se déroulent à l'intérieur de chaque cellule d'un être vivant et lui permettent notamment de se maintenir en vie, de se reproduire (se diviser), de se développer et de répondre aux stimuli de son environnement (échanges par exemple). Certaines de ces réactions chimiques se déroulent en dehors des cellules de l'organisme, comme la digestion ou le transport de substances entre cellules. Cependant, la plupart de ces réactions ont lieu dans les cellules elles-mêmes et constituent le métabolisme intermédiaire.