Nettoyage de donnéesLe nettoyage de données est l'opération de détection et de correction (ou suppression) d'erreurs présentes sur des données stockées dans des bases de données ou dans des fichiers. Le nettoyage de données est un des problèmes majeurs des entrepôts de données. Les données présentes dans les bases de données peuvent avoir plusieurs types d'erreurs comme des erreurs de frappe, des informations manquantes, des imprécisions etc. La partie impropre de la donnée traitée peut être remplacée, modifiée ou supprimée.
GèneUn gène, du grec ancien (« génération, naissance, origine »), est, en biologie, une séquence discrète et héritable de nucléotides dont l'expression affecte les caractères d'un organisme. L'ensemble des gènes et du matériel non codant d'un organisme constitue son génome. Un gène possède donc une position donnée dans le génome d'une espèce, on parle de locus génique. La séquence est généralement formée par des désoxyribonucléotides, et est donc une séquence d'ADN (par des ribonucléotides formant de l'ARN dans le cas de certains virus), au sein d'un chromosome.
Réseaux de régulation géniquedroite|vignette|360x360px| Structure d'un réseau de régulation génique droite|vignette|360x360px| Processus de contrôle d'un réseau de régulation génique Un réseau de régulation génique (ou génétique ) ( RRG ), réseau de régulation des gènes ou réseaux de régulation transcriptionnelle est un ensemble de régulateurs moléculaires qui interagissent entre eux et avec d'autres substances dans une cellule pour moduler l'expression génique de l'ARNm et des protéines qui, à leur tour, déterminent la fonction de la c
Lac de donnéesUn lac de données (en anglais data lake) est une méthode de stockage de données massives utilisée par le big data (mégadonnées en français). Ces données sont gardées dans leurs formats originaux ou sont très peu transformées. Le lac de données donne la priorité au stockage rapide et volumineux de données hétérogènes en adoptant une architecture en cluster. Il n'est pas optimisé pour les requêtes SQL comme les SGBD relationnels classiques, et s'écarte des Propriétés ACID traditionnelles. On parle depuis 2010 de SGBD NoSQL.
Corps humainLe corps humain est la structure culturelle et physique d'un être humain. Le corps humain est constitué de plusieurs systèmes (nerveux, digestif), ainsi que de 206 os et 639 muscles dont 570 sont des muscles squelettiques. La science et la pratique visant à décrire l'organisation et le fonctionnement du corps humain est l'anatomie humaine, qui est une spécialité de la médecine. La médecine vise plus généralement à préserver la santé, c'est-à-dire le fonctionnement normal du corps humain.
Big dataLe big data ( « grosses données » en anglais), les mégadonnées ou les données massives, désigne les ressources d’informations dont les caractéristiques en termes de volume, de vélocité et de variété imposent l’utilisation de technologies et de méthodes analytiques particulières pour créer de la valeur, et qui dépassent en général les capacités d'une seule et unique machine et nécessitent des traitements parallélisés. L’explosion quantitative (et souvent redondante) des données numériques permet une nouvelle approche pour analyser le monde.
Analyse par les options réellesL'analyse par les options réelles (AOR) est un outil financier d'aide à la décision en matière d'investissement, directement inspiré des techniques d’options financières (« call » ou « put »). L’option réelle permet de prendre une décision stratégique d'investissement relative à un actif sous-jacent non financier. Ce sous-jacent peut être un projet ou un actif réel du type : bien d'équipement, usine de production, projet R&D, activité en phase de démarrage ou de croissance, ou bien encore propriété intellectuelle.
Génomique comparativeLa génomique comparative est l'étude comparative de la structure en fonction des génomes de différentes espèces. Elle permet d'identifier et de comprendre les effets de la sélection sur l'organisation et l'évolution des génomes. Ce nouvel axe de recherche bénéficie de l'augmentation du nombre de génomes séquencés et de la puissance des outils informatiques. Une des applications majeures de la génomique comparative est la découverte de gènes et de leurs séquences régulatrices non codantes basée sur le principe de conservation.
Analyse des donnéesL’analyse des données (aussi appelée analyse exploratoire des données ou AED) est une famille de méthodes statistiques dont les principales caractéristiques sont d'être multidimensionnelles et descriptives. Dans l'acception française, la terminologie « analyse des données » désigne donc un sous-ensemble de ce qui est appelé plus généralement la statistique multivariée. Certaines méthodes, pour la plupart géométriques, aident à faire ressortir les relations pouvant exister entre les différentes données et à en tirer une information statistique qui permet de décrire de façon plus succincte les principales informations contenues dans ces données.
PliocèneSur l'échelle des temps géologiques, le est la plus récente époque géologique du Néogène. S'étendant de 5,332 ± 0,005 à 2,588 ± 0,005 millions d’années, il est suivi du Pléistocène et précédé par le Miocène. Cette période a été dénommée par Charles Lyell à partir du grec (« plus ») et (« nouveau », « plus récent »), en référence aux mammifères déjà essentiellement modernes. upright|vignette|Inversions récentes du champ magnétique. Les zones noires indiquent une polarité identique à la polarité actuelle du globe, les zones blanches une polarité inverse.