Puce à ADNthumb|upright=1.2|Principe d'utilisation de la puce à ADN. Une puce à ADN est un ensemble de molécules d'ADN fixées en rangées ordonnées sur une petite surface qui peut être du verre, du silicium ou du plastique. Cette biotechnologie récente permet d'analyser le niveau d'expression des gènes (transcrits) dans une cellule, un tissu, un organe, un organisme ou encore un mélange complexe, à un moment donné et dans un état donné par rapport à un échantillon de référence.
Surapprentissagevignette|300x300px|La ligne verte représente un modèle surappris et la ligne noire représente un modèle régulier. La ligne verte classifie trop parfaitement les données d'entrainement, elle généralise mal et donnera de mauvaises prévisions futures avec de nouvelles données. Le modèle vert est donc finalement moins bon que le noir. En statistique, le surapprentissage, ou sur-ajustement, ou encore surinterprétation (en anglais « overfitting »), est une analyse statistique qui correspond trop précisément à une collection particulière d'un ensemble de données.
Pronostic (médecine)En médecine, le pronostic (du grec ancien πρόγνωσις, grec moderne πρόγνωση - littéralement savoir d'avance, prévoir) est la prédiction d'un médecin concernant le développement futur de l'état de son patient, et les chances éventuelles de guérison. Depuis le , le mot est de plus en plus utilisé dans des contextes non-médicaux. Il ne faut pas confondre le « pronostic » (nom) avec « pronostique » (adjectif), utilisé, par exemple, dans « la valeur pronostique d'un examen ».
Orange (logiciel)Orange is an open-source data visualization, machine learning and data mining toolkit. It features a visual programming front-end for explorative qualitative data analysis and interactive data visualization. Orange is a component-based visual programming software package for data visualization, machine learning, data mining, and data analysis. Orange components are called widgets. They range from simple data visualization, subset selection, and preprocessing to empirical evaluation of learning algorithms and predictive modeling.
Data blendingData blending is a process whereby big data from multiple sources are merged into a single data warehouse or data set. It concerns not merely the merging of different s or disparate sources of data but also different varieties of data. Data blending allows business analysts to cope with the expansion of data that they need to make critical business decisions based on good quality business intelligence. Data blending has been described as different from data integration due to the requirements of data analysts to merge sources very quickly, too quickly for any practical intervention by data scientists.
PrévalenceEn épidémiologie, la prévalence est le rapport entre l'ensemble des cas présents ou passés d'un évènement ou d'une maladie et l'ensemble de la population exposée, à une date donnée. Ce rapport représente la proportion de personnes concernées par le phénomène et n'a pas d'unité. Prévalence et taux de prévalence sont deux termes équivalents. La prévalence est exprimée en pourcentage, en taux pour une population donnée, par exemple 100 000 individus (mais tout autre nombre est possible et doit être précisé).
SynapomorphieEn phylogénétique, un caractère synapomorphique, ou synapomorphie, est un caractère dérivé (ou apomorphique), partagé par deux ou plusieurs taxons-frères. Le partage par au moins deux taxons certifie que la dérive du caractère n'est pas simplement contingente, mais est persistante et caractéristique de nouvelles espèces viables. Une synapomorphie détermine ainsi un groupe monophylétique strict, ou clade, seul type de groupe reconnu par le cladisme.