Analyse des donnéesL’analyse des données (aussi appelée analyse exploratoire des données ou AED) est une famille de méthodes statistiques dont les principales caractéristiques sont d'être multidimensionnelles et descriptives. Dans l'acception française, la terminologie « analyse des données » désigne donc un sous-ensemble de ce qui est appelé plus généralement la statistique multivariée. Certaines méthodes, pour la plupart géométriques, aident à faire ressortir les relations pouvant exister entre les différentes données et à en tirer une information statistique qui permet de décrire de façon plus succincte les principales informations contenues dans ces données.
Big dataLe big data ( « grosses données » en anglais), les mégadonnées ou les données massives, désigne les ressources d’informations dont les caractéristiques en termes de volume, de vélocité et de variété imposent l’utilisation de technologies et de méthodes analytiques particulières pour créer de la valeur, et qui dépassent en général les capacités d'une seule et unique machine et nécessitent des traitements parallélisés. L’explosion quantitative (et souvent redondante) des données numériques permet une nouvelle approche pour analyser le monde.
3'-UTRLa région 3' non traduite, ou 3'-UTR (de anglais, three prime Untranslated Transcribed Region) est la partie de l’ARN messager (ARNm) qui suit le codon STOP (à l'extrémité 3'). Une molécule d’ARNm est transcrite à partir de la séquence d’ADN pour être traduite plus tard en protéine. Plusieurs parties de l’ARNm ne sont pas traduites en protéine, dont la coiffe ou 5'-cap, les régions 5'-UTR et 3'-UTR et la queue poly(A). La partie 3'-UTR contient souvent des régions qui influencent l’expression des gènes après la transcription.
Régulation de la transcriptionLa régulation de la transcription est la phase du contrôle de l'expression des gènes agissant au niveau de la transcription de l'ADN. Cette régulation modifiera la quantité d'ARN produit. Cette régulation est principalement effectuée par la modulation du taux de transcription par l'intervention de facteurs de transcription qui se classent en deux catégories : les éléments cis-regulateurs géniques, en coopération avec les facteurs transprotéiques. Il existe également des mécanismes de régulation de la terminaison de la transcription.
Matrice d'adjacenceEn mathématiques, en théorie des graphes, en informatique, une matrice d'adjacence pour un graphe fini à n sommets est une matrice de dimension n × n dont l'élément non diagonal a est le nombre d'arêtes liant le sommet i au sommet j. L'élément diagonal a est le nombre de boucles au sommet i (pour des graphes simples, ce nombre est donc toujours égal à 0 ou 1). Cet outil mathématique est très utilisé comme structure de données en informatique (tout comme la représentation par liste d'adjacence), mais intervient aussi naturellement dans les chaînes de Markov.
Séquence consensusEn biologie moléculaire et en bioinformatique, une séquence consensus est la séquence nucléotidique ou la séquence peptidique la plus fréquente à chaque position d'un alignement de séquences. Elle représente le résultat d'alignements de séquences multiples dans lesquelles les séquences apparentées sont comparées les unes aux autres afin de déterminer les motifs les plus fréquents. Cette information est importante pour les protéines dépendantes des séquences nucléotidiques, telles que les ARN polymérases.
Produit matriciel de Hadamardvignette|Illustration du produit de Hadamard: il s'applique à deux matrices de mêmes dimensions et la matrice en resultant a les mêmes dimensions également. En mathématiques, le produit matriciel de Hadamard, nommé d'après le mathématicien français Jacques Hadamard et parfois désigné produit de Schur, est une opération binaire qui pour deux matrices de mêmes dimensions, associe une autre matrice, de même dimension, et où chaque coefficient est le produit terme à terme des deux matrices.
DNA methylationDNA methylation is a biological process by which methyl groups are added to the DNA molecule. Methylation can change the activity of a DNA segment without changing the sequence. When located in a gene promoter, DNA methylation typically acts to repress gene transcription. In mammals, DNA methylation is essential for normal development and is associated with a number of key processes including genomic imprinting, X-chromosome inactivation, repression of transposable elements, aging, and carcinogenesis.
Acide ribonucléique messagervignette|Représentation schématique de la synthèse et de la maturation d'un ARN messager dans une cellule eucaryote. L'acide ribonucléique messager, ARN messager, ou ARNm (en anglais, mRNA, pour messenger ribonucleic acid), est une molécule intermédiaire d'acide ribonucléique (ARN), consistant en une copie transitoire d'une portion de l'ADN correspondant à un ou plusieurs gènes d'un organisme biologique. L'ARNm est utilisé comme intermédiaire par les cellules pour la synthèse des protéines.
Gène de novoUn gène de novo est un gène nouveau qui ne provient pas de gènes préexistants mais de l'ADN non codant. Son apparition se produit chez un individu, pas dans l'espèce entière ; il se répand ensuite sous l'effet de la sélection naturelle ou de la dérive génétique, et s'améliore sous la pression sélective. Inconnus jusqu'en 2006, les gènes de novo pourraient constituer quelques dizaines de pour cent des gènes de nombreuses espèces. À la fin du il était admis que de nouveaux gènes ne peuvent apparaître que par la modification ou la recombinaison de gènes préexistants.