Repliement des protéinesthumb|right|300px|Repliement des protéines Le repliement des protéines est le processus physique par lequel un polypeptide se replie dans sa structure tridimensionnelle caractéristique dans laquelle il est fonctionnel. Chaque protéine commence sous forme de polypeptide, transcodée depuis une séquence d'ARNm en une chaîne linéaire d'acides aminés. Ce polypeptide ne possède pas à ce moment de structure tridimensionnelle développée (voir côté gauche de la figure).
ADN polymérase Ivignette|Domaines fonctionnels du fragment de Klenow (à gauche) et de l'ADN polymérase I (à droite). LADN polymérase I, ou pol I, est une ADN polymérase présente chez les bactéries et intervenant dans la réplication de l'ADN. Elle est la toute première polymérase découverte, en 1956. Chez E. coli, elle est codée dans le gène polA et compte d'acides aminés ; c'est un exemple d'enzyme processive, c'est-à-dire capable de catalyser un grand nombre de polymérisations successives.
DonnéeUne donnée est ce qui est connu et qui sert de point de départ à un raisonnement ayant pour objet la détermination d'une solution à un problème en relation avec cette donnée. Cela peut être une description élémentaire qui vise à objectiver une réalité, le résultat d'une comparaison entre deux événements du même ordre (mesure) soit en d'autres termes une observation ou une mesure. La donnée brute est dépourvue de tout raisonnement, supposition, constatation, probabilité.
Regulator geneA regulator gene, regulator, or regulatory gene is a gene involved in controlling the expression of one or more other genes. Regulatory sequences, which encode regulatory genes, are often at the five prime end (5') to the start site of transcription of the gene they regulate. In addition, these sequences can also be found at the three prime end (3') to the transcription start site. In both cases, whether the regulatory sequence occurs before (5') or after (3') the gene it regulates, the sequence is often many kilobases away from the transcription start site.
GèneUn gène, du grec ancien (« génération, naissance, origine »), est, en biologie, une séquence discrète et héritable de nucléotides dont l'expression affecte les caractères d'un organisme. L'ensemble des gènes et du matériel non codant d'un organisme constitue son génome. Un gène possède donc une position donnée dans le génome d'une espèce, on parle de locus génique. La séquence est généralement formée par des désoxyribonucléotides, et est donc une séquence d'ADN (par des ribonucléotides formant de l'ARN dans le cas de certains virus), au sein d'un chromosome.
Big dataLe big data ( « grosses données » en anglais), les mégadonnées ou les données massives, désigne les ressources d’informations dont les caractéristiques en termes de volume, de vélocité et de variété imposent l’utilisation de technologies et de méthodes analytiques particulières pour créer de la valeur, et qui dépassent en général les capacités d'une seule et unique machine et nécessitent des traitements parallélisés. L’explosion quantitative (et souvent redondante) des données numériques permet une nouvelle approche pour analyser le monde.
Répresseurvignette|droite|Répresseur lactose complexé à son site opérateur Un répresseur est une molécule, souvent une protéine, régulant négativement la transcription d'un ou de plusieurs gènes en se liant à une séquence spécifique sur l'ADN, appelée opérateur. Cette fixation empêche la transcription de l'ARN messager par l'ARN polymérase et donc l'expression des gènes en aval. La capacité du répresseur à se fixer à son opérateur peut être modulée par un signal extérieur, comme la fixation d'un métabolite.
Gestion des donnéesLa gestion des données est une discipline de gestion qui tend à valoriser les données en tant que ressources numériques. La gestion des données permet d'envisager le développement d'architectures, de réglementations, de pratiques et de procédures qui gèrent correctement les besoins des organismes sur le plan de tout le cycle de vie des données. Les données sont, avec les traitements, l'un des deux aspects des systèmes d'information traditionnellement identifiés, et l'un ne peut aller sans l'autre pour un management du système d'information cohérent.
Nucléoprotéinevignette|400x400px| Un nucléosome est une combinaison d'ADN + protéines histones. Les nucléoprotéines sont des protéines conjuguées à des acides nucléiques (soit ADN soit ARN). Les nucléoprotéines typiques comprennent les ribosomes, les nucléosomes et les protéines de la nucléocapside virale. vignette|227x227px| Dessin en coupe de la particule du virus Ebola, avec les structures des principales protéines représentées et étiquetées à droite Les nucléoprotéines ont tendance à être chargées positivement, facilitant l'interaction avec les chaînes d'acide nucléique chargées négativement.
Séquence consensusEn biologie moléculaire et en bioinformatique, une séquence consensus est la séquence nucléotidique ou la séquence peptidique la plus fréquente à chaque position d'un alignement de séquences. Elle représente le résultat d'alignements de séquences multiples dans lesquelles les séquences apparentées sont comparées les unes aux autres afin de déterminer les motifs les plus fréquents. Cette information est importante pour les protéines dépendantes des séquences nucléotidiques, telles que les ARN polymérases.