DonnéeUne donnée est ce qui est connu et qui sert de point de départ à un raisonnement ayant pour objet la détermination d'une solution à un problème en relation avec cette donnée. Cela peut être une description élémentaire qui vise à objectiver une réalité, le résultat d'une comparaison entre deux événements du même ordre (mesure) soit en d'autres termes une observation ou une mesure. La donnée brute est dépourvue de tout raisonnement, supposition, constatation, probabilité.
Gestion des donnéesLa gestion des données est une discipline de gestion qui tend à valoriser les données en tant que ressources numériques. La gestion des données permet d'envisager le développement d'architectures, de réglementations, de pratiques et de procédures qui gèrent correctement les besoins des organismes sur le plan de tout le cycle de vie des données. Les données sont, avec les traitements, l'un des deux aspects des systèmes d'information traditionnellement identifiés, et l'un ne peut aller sans l'autre pour un management du système d'information cohérent.
Big dataLe big data ( « grosses données » en anglais), les mégadonnées ou les données massives, désigne les ressources d’informations dont les caractéristiques en termes de volume, de vélocité et de variété imposent l’utilisation de technologies et de méthodes analytiques particulières pour créer de la valeur, et qui dépassent en général les capacités d'une seule et unique machine et nécessitent des traitements parallélisés. L’explosion quantitative (et souvent redondante) des données numériques permet une nouvelle approche pour analyser le monde.
Science des donnéesLa science des données est l'étude de l’extraction automatisée de connaissance à partir de grands ensembles de données. Plus précisément, la science des données est un domaine interdisciplinaire qui utilise des méthodes, des processus, des algorithmes et des systèmes scientifiques pour extraire des connaissances et des idées à partir de nombreuses données structurées ou non . Elle est souvent associée aux données massives et à l'analyse des données.
Acide ribonucléique de transfertLes acides ribonucléiques de transfert, ou ARN de transfert ou ARNt, sont de courts ARN, longs de 75 à 95 nucléotides, qui interviennent lors de la synthèse des protéines dans la cellule. Ce sont des intermédiaires clés dans la traduction du message génétique et dans la lecture du code génétique. Ils apportent les acides aminés au ribosome, la machine cellulaire responsable de l'assemblage des protéines à partir de l'information génétique contenue dans l'ARN messager.
Data dredgingvignette|Exemple de Data dredging. Le data dredging (littéralement le dragage de données mais mieux traduit comme étant du triturage de données) est une technique statistique qui . Une des formes du data dredging est de partir de données ayant un grand nombre de variables et un grand nombre de résultats, et de choisir les associations qui sont « statistiquement significatives », au sens de la valeur p (on parle aussi de p-hacking).
Acide ribonucléique ribosomiquevignette|Structure atomique de la grande sous-unité 50S des ribosomes de procaryotes.Les protéines sont colorées en bleu et les ARN en orange. Le site actif, l'adénine 2486 est coloré en rouge L'ARN ribosomique (ARNr) ou ARN ribosomal par anglicisme (ribosomal RNA, rRNA, en anglais) est le constituant principal des ribosomes, auxquels il donne leur nom. Les différents ARNr sont à la fois l'ossature et le cœur du ribosome, un complexe ribonucléoprotéique (composé de protéines et d'ARN) servant à la traduction de l'information génétique codée sur un ARN messager (ARNm).
Nucléoprotéinevignette|400x400px| Un nucléosome est une combinaison d'ADN + protéines histones. Les nucléoprotéines sont des protéines conjuguées à des acides nucléiques (soit ADN soit ARN). Les nucléoprotéines typiques comprennent les ribosomes, les nucléosomes et les protéines de la nucléocapside virale. vignette|227x227px| Dessin en coupe de la particule du virus Ebola, avec les structures des principales protéines représentées et étiquetées à droite Les nucléoprotéines ont tendance à être chargées positivement, facilitant l'interaction avec les chaînes d'acide nucléique chargées négativement.
Exploratory data analysisIn statistics, exploratory data analysis (EDA) is an approach of analyzing data sets to summarize their main characteristics, often using statistical graphics and other data visualization methods. A statistical model can be used or not, but primarily EDA is for seeing what the data can tell us beyond the formal modeling and thereby contrasts traditional hypothesis testing. Exploratory data analysis has been promoted by John Tukey since 1970 to encourage statisticians to explore the data, and possibly formulate hypotheses that could lead to new data collection and experiments.
Entrepôt de donnéesvignette|redresse=1.5|Vue d'ensemble d'une architecture entrepôt de données. Le terme entrepôt de données ou EDD (ou base de données décisionnelle ; en anglais, data warehouse ou DWH) désigne une base de données utilisée pour collecter, ordonner, journaliser et stocker des informations provenant de base de données opérationnelles et fournir ainsi un socle à l'aide à la décision en entreprise. Un entrepôt de données est une base de données regroupant une partie ou l'ensemble des données fonctionnelles d'une entreprise.