Science des donnéesLa science des données est l'étude de l’extraction automatisée de connaissance à partir de grands ensembles de données. Plus précisément, la science des données est un domaine interdisciplinaire qui utilise des méthodes, des processus, des algorithmes et des systèmes scientifiques pour extraire des connaissances et des idées à partir de nombreuses données structurées ou non . Elle est souvent associée aux données massives et à l'analyse des données.
BiopsieUne biopsie (du grec , « vie » et , « vue ») est le prélèvement d'une très petite partie d'un organe ou d'un tissu pour effectuer des examens concernant un être vivant. Elle peut être effectuée au moyen d'une aiguille ou par frottis sur tout type de tissu humain. Cette technique permet de déterminer ou de confirmer une pathologie soupçonnée. Elle est largement utilisée en oncologie, mais aussi en génétique, en neurologie, en dermatologie ou encore en hépatologie. Certaines maladies ne peuvent être identifiées que grâce à cet examen.
Facteur stimulant les colonies de granulocytes et de macrophagesLe facteur stimulant les colonies de granulocytes et de macrophages (GM-CSF), également appelé facteur 2 stimulant les colonies (CSF2), est une glycoprotéine monomère sécrétée par les macrophages, les cellules T, les mastocytes, les cellules tueuses naturelles, les cellules endothéliales et les fibroblastes, qui fonctionne telle une cytokine. Les analogues pharmaceutiques de GM-CSF d'origine naturelle sont appelés sargramostim et molgramostim.
Granulocyte neutrophileLes granulocytes neutrophiles ou polynucléaires neutrophiles (PNN) (ou simplement « les neutrophiles ») sont des cellules sanguines appartenant à la lignée blanche. Ce sont des globules blancs (leucocytes) qui ont un rôle majeur dans le système immunitaire. Les neutrophiles font partie des cellules granulocytes ou « cellules polynucléaires ». On les appelle polynucléaires en raison d'une erreur historique : de par le caractère plurilobé de leur noyau (de deux à cinq lobes en général), on a longtemps cru que ces cellules possédaient plusieurs noyaux.
Data dredgingvignette|Exemple de Data dredging. Le data dredging (littéralement le dragage de données mais mieux traduit comme étant du triturage de données) est une technique statistique qui . Une des formes du data dredging est de partir de données ayant un grand nombre de variables et un grand nombre de résultats, et de choisir les associations qui sont « statistiquement significatives », au sens de la valeur p (on parle aussi de p-hacking).
Leucémie aigüe myéloïdeLa (LAM), aussi appelée leucémie aigüe myéloblastique, est un cancer de type hémopathie maligne affectant les cellules hématopoïétiques de la moelle osseuse. Les cellules leucémiques, appelées blastes, sont caractérisées par une incapacité à se différencier en cellules matures et par une prolifération incontrôlée. Ce dysfonctionnement de la moelle osseuse empêche la production normale des cellules sanguines et se traduit par divers syndromes cliniques, parfois très graves (infection, hémorragie, etc.).
Testing hypotheses suggested by the dataIn statistics, hypotheses suggested by a given dataset, when tested with the same dataset that suggested them, are likely to be accepted even when they are not true. This is because circular reasoning (double dipping) would be involved: something seems true in the limited data set; therefore we hypothesize that it is true in general; therefore we wrongly test it on the same, limited data set, which seems to confirm that it is true.
Endothéliumvignette|Comparaison de l'endothélium vasculaire sain et dysfonctionnel. L'endothélium vasculaire est la couche la plus interne des vaisseaux sanguins, celle en contact avec le sang. Les dégradations pathologiques de l'endothélium sont dites « endothélites » ou endothéliites ( Kérato-endothélite, quand le phénomène se déclare dans l’œil, à la suite d'un herpès, un zona ophtalmique, un lupus, une piqure d'abeille, une greffe de cornée ou kératoplastie...).
Large numbersLarge numbers are numbers significantly larger than those typically used in everyday life (for instance in simple counting or in monetary transactions), appearing frequently in fields such as mathematics, cosmology, cryptography, and statistical mechanics. They are typically large positive integers, or more generally, large positive real numbers, but may also be other numbers in other contexts. Googology is the study of nomenclature and properties of large numbers.
Exploratory data analysisIn statistics, exploratory data analysis (EDA) is an approach of analyzing data sets to summarize their main characteristics, often using statistical graphics and other data visualization methods. A statistical model can be used or not, but primarily EDA is for seeing what the data can tell us beyond the formal modeling and thereby contrasts traditional hypothesis testing. Exploratory data analysis has been promoted by John Tukey since 1970 to encourage statisticians to explore the data, and possibly formulate hypotheses that could lead to new data collection and experiments.