Taux de GCLe taux de GC (ou pourcentage de GC, ou coefficient de Chargaff) d'une séquence d'ADN est défini comme la proportion de bases nucléiques de cette séquence étant soit une guanine (G), soit une cytosine (C). Il existe deux bases nucléiques supplémentaires, l'adénine (A) et la thymine (T), entrant dans la composition de l'ADN. De plus, la cytosine est toujours liée à la guanine, et l'adénine est toujours liée à la thymine. Ainsi, le taux de GC exprime aussi le pourcentage de liaisons G-C dans la molécule d'ADN.
Ensemble statistiqueEn physique statistique, un ensemble statistique est une abstraction qui consiste à considérer une collection de copies virtuelles (ou répliques) d'un système physique dans l'ensemble des états accessibles où il est susceptible de se trouver, compte tenu des contraintes extérieures qui lui sont imposées, telles le volume, le nombre de particules, l'énergie et la température. Cette notion, introduite par le physicien américain Josiah Willard Gibbs en 1902, est un concept central de la physique statistique.
Économie mathématiquevignette|Les acteurs économiques (STN et actionnaires) sont classés par importance décroissante, donnée par . Un point de données situé en () correspond à une fraction des principaux acteurs économiques détenant cumulativement la fraction du contrôle, de la valeur ou des revenus d'exploitation du réseau. Les différentes courbes se réfèrent au contrôle du réseau calculé avec trois modèles (LM, TM, RM), voir l'annexe S1, section 3.1, et aux revenus d'exploitation. La ligne horizontale indique une valeur égale à .
Micro-état (physique statistique)En physique statistique, un micro-état (appelé aussi configuration microscopique ou bien état microscopique) est la spécification détaillée d'une configuration microscopique d'un système. Le système visite ce micro-état au cours de ses fluctuations thermiques. Par contraste, le macro-état (appelé aussi configuration macroscopique ou encore état macroscopique) d'un système fait référence à ses propriétés macroscopiques, telles que la pression et la température.
Nucléosomevignette|Schéma de trois nucléosomes mis bout à bout, formant une partie d'un nucléofilament de 11 nm. Le nucléosome est un complexe comportant un segment d’ADN de 146 ou 147 paires de nucléotides, enroulé autour d'un cœur formé de protéines (les histones). Chez les eucaryotes, le nucléosome constitue l’unité de base d'organisation de la chromatine. Il représente le premier niveau de compaction de l’ADN dans le noyau, on compare souvent sa géométrie à celle d'un fil enroulé autour d'une bobine.
Séquence codantevignette|Schéma simplifié du dogme central de la biologie moléculaire. Certaines séquences d'ADN subissent une transcription afin de générer un ARN messager primaire. Cet ARNm subit différentes transformations, notamment l'épissage, par lequel les introns sont enlevés, pour générer un transcrit mature. Finalement, les ribosomes traduisent la séquence codante en protéine. La séquence codante est indiquée en vert.
Entropie de ShannonEn théorie de l'information, l'entropie de Shannon, ou plus simplement entropie, est une fonction mathématique qui, intuitivement, correspond à la quantité d'information contenue ou délivrée par une source d'information. Cette source peut être un texte écrit dans une langue donnée, un signal électrique ou encore un fichier informatique quelconque (suite d'octets). Elle a été introduite par Claude Shannon. Du point de vue d'un récepteur, plus la source émet d'informations différentes, plus l'entropie (ou incertitude sur ce que la source émet) est grande.
Regroupement hiérarchiqueDans le domaine de l'analyse et de la classification automatique de données, le regroupement hiérarchique est un partitionnement de données ou clustering, au moyen de diverses méthodes, dites « ascendantes » et « descendantes ». Les méthodes dites « descendantes » partent d’une solution générale vers une autre plus spécifique. Les méthodes de cette catégorie démarrent avec une seule classe contenant la totalité puis se divisent à chaque étape selon un critère jusqu’à l’obtention d’un ensemble de classes différentes.
Sequence analysisIn bioinformatics, sequence analysis is the process of subjecting a DNA, RNA or peptide sequence to any of a wide range of analytical methods to understand its features, function, structure, or evolution. Methodologies used include sequence alignment, searches against biological databases, and others. Since the development of methods of high-throughput production of gene and protein sequences, the rate of addition of new sequences to the databases increased very rapidly.
Dénaturation de l'ADNLa dénaturation de l'ADN, ou fonte de l'ADN, est un processus qui conduit à transformer un double brin d'ADN en deux simples brins, en rompant les liaisons hydrogène entre les bases nucléiques des deux chaînes complémentaires de l'ADN. Cette dénaturation peut être réalisée in vitro en soumettant l'ADN à tout agent chimique ou physique capable de déstabiliser les liaisons hydrogène, comme le pH, la température, certains solvants, des concentrations ioniques élevées, des agents alcalins,...