Séquence (acide nucléique)vignette| Séquence d'un ARN messager faisant apparaître ses codons. La séquence d'un acide nucléique — ADN ou ARN — est la succession des nucléotides qui le constituent. Cette succession contient l'information génétique portée par ces polynucléotides, de sorte qu'on la qualifie également de séquence génétique ou parfois de séquence nucléotidique. Elle peut être déterminée par des méthodes de séquençage de l'ADN. Les séquences nucléotidiques sont conventionnellement écrites dans le sens , qui est celui dans lequel sont lues et synthétisées ces biomolécules.
Protéineredresse=1.36|vignette|Représentation d'une protéine, ici deux sous-unités d'une molécule d'hémoglobine. On observe les représentées en couleur, ainsi que deux des quatre molécules d'hème, qui sont les groupes prosthétiques caractéristiques de cette protéine. redresse=1.36|vignette|Liaison peptidique –CO–NH– au sein d'un polypeptide. Le motif constitue le squelette de la protéine, tandis que les groupes liés aux sont les chaînes latérales des résidus d'acides aminés.
GèneUn gène, du grec ancien (« génération, naissance, origine »), est, en biologie, une séquence discrète et héritable de nucléotides dont l'expression affecte les caractères d'un organisme. L'ensemble des gènes et du matériel non codant d'un organisme constitue son génome. Un gène possède donc une position donnée dans le génome d'une espèce, on parle de locus génique. La séquence est généralement formée par des désoxyribonucléotides, et est donc une séquence d'ADN (par des ribonucléotides formant de l'ARN dans le cas de certains virus), au sein d'un chromosome.
Escherichia coliEscherichia coli, en abrégée E. coli, est une bactérie intestinale des organismes à sang chaud, Gram négatif, du genre Escherichia, en forme de bâtonnet. E. coli est une bactérie aero-anaerobie facultative, appartenant au groupe des colibacilles, très commune chez l'être humain. E. coli constitue, avec d'autres bactéries anaérobies facultatives, 0,1% du microbiote intestinal. Découverte en 1885, par le pédiatre et bactériologiste austro-allemand Theodor Escherich, dans des selles de chèvres, c'est un coliforme fécal généralement commensal.
Cadre de lecture ouvertvignette|Échantillon En génétique moléculaire, un cadre de lecture ouvert, ou phase ouverte de lecture (open reading frame ou ORF en anglais), est une partie d'un cadre de lecture susceptible d'être traduit en protéine ou en peptide. C'est une suite de codons comprenant le codon start et un codon stop, généralement UAA, UAG ou UGA. Un codon d'initiation AUG du cadre de lecture ouvert — codon qui n'est pas nécessairement le premier de celui-ci — peut indiquer le début de la traduction.
Repliement des protéinesthumb|right|300px|Repliement des protéines Le repliement des protéines est le processus physique par lequel un polypeptide se replie dans sa structure tridimensionnelle caractéristique dans laquelle il est fonctionnel. Chaque protéine commence sous forme de polypeptide, transcodée depuis une séquence d'ARNm en une chaîne linéaire d'acides aminés. Ce polypeptide ne possède pas à ce moment de structure tridimensionnelle développée (voir côté gauche de la figure).
Cadre de lectureredresse=1.5|vignette|Exemple de cadres de lecture dans un segment d'ADN : AGG·TGA·CAC·CGC·AAG·CCT·TAT·ATT·AGCA·GGT·GAC·ACC·GCA·AGC·CTT·ATA·TTA·GCAG·GTG·ACA·CCG·CAA·GCC·TTA·TAT·TAG·C En biologie moléculaire, un cadre de lecture est un mode de regroupement des nucléotides constituant la séquence d'un acide nucléique — ADN et ARN — en triplets consécutifs, qui se succèdent sans interruption ni recouvrement. Lorsque ces triplets encodent des acides aminés ou la fin de la traduction génétique, ils sont appelés codons.
Polymorphisme nucléotidiquevignette|La molécule d'ADN 1 diffère de la 2 par un seul nucléotide (polymorphisme C/T). Le polymorphisme nucléotidique (PN, ou polymorphisme d'un seul nucléotide, PSN ; single nucleotide polymorphism, SNP) est, en génétique, la variation (polymorphisme) d'une seule paire de bases du génome entre individus d'une même espèce, ou entre un individu et la séquence de référence de l'espèce. La variation doit être située à un endroit spécifique du génome et apparaître sur une proportion supérieure à 1 % de la population pour être caractérisée comme PSN.
Facteur de transcriptionvignette|upright=2.2|Schéma simplifié du mécanisme d'un activateur. Un facteur de transcription est une protéine nécessaire à l'initiation ou à la régulation de la transcription d'un gène dans l'ensemble du vivant (procaryote ou eucaryote). Elle interagit avec l'ADN et l'ARN-polymérase. Il existe une classification complexe des facteurs de transcription. Les facteurs généraux de la transcription, impliqués dans la composition de la machinerie transcriptionnelle basale organisée autour de l'ARN polymérase II.
Séquence homologueEn biologie moléculaire, les séquences homologues sont deux ou plusieurs séquences nucléotidiques partageant une origine évolutive commune, c'est-à-dire présentant une homologie au sens de l'évolution moléculaire. Deux segments d'ADN distincts sont susceptibles d'avoir une origine commune à la suite d'une spéciation (orthologie), d'une duplication (paralogie) ou d'un transfert horizontal de gènes.