Séquence codantevignette|Schéma simplifié du dogme central de la biologie moléculaire. Certaines séquences d'ADN subissent une transcription afin de générer un ARN messager primaire. Cet ARNm subit différentes transformations, notamment l'épissage, par lequel les introns sont enlevés, pour générer un transcrit mature. Finalement, les ribosomes traduisent la séquence codante en protéine. La séquence codante est indiquée en vert.
Séquence conservéeEn biologie de l'évolution, les séquences conservées sont des séquences d'acides nucléiques (ADN et ARN) ou d'acide aminés identiques ou similaires au sein d'un génome (on parle alors de séquences paralogues) ; à travers les espèces (on parle alors de séquences orthologues), ou bien encore entre un taxon donneur et un taxon récepteur (on parle alors de séquences xénologues). La conservation indique qu'une séquence a été maintenue par la sélection naturelle.
Biais d'usage du codeLe biais d'usage du code (RSCU, pour Relative Synonymous Codon Usage en anglais) désigne l'utilisation préférentielle d'un des triplets de nucléotides ou codons possibles pour coder un acide aminé. En effet, il existe en général plusieurs combinaisons de trois nucléotides codant le même acide-aminé (sauf pour la méthionine et le tryptophane), appelés codons synonymes, mais certaines de ces combinaisons sont en général utilisées préférentiellement par la cellule.
Code génétique225px|droite|vignette| À gauche, un brin d'ARNm avec sa séquence de bases nucléiques ; à droite, les codons correspondants, chacun spécifiant un acide aminé protéinogène. Le code génétique est l'ensemble des règles permettant de traduire les informations contenues dans le génome des cellules vivantes afin de synthétiser les protéines. Au sens large, il établit la correspondance entre le génotype et le phénotype d'un organisme.
Dicervignette|La protéine Dicer Dicer est une enzyme impliquée dans le processus d'ARN interférence. Ses quatre domaines protéiques sont encodés par le gène DICER1. La protéine dicer composée de 1922 acides aminés, aussi connue sous le nom d’endoribonucléase dicer, est une ribonucléase de classe 3 qui clive les fragments doubles brins d’ARN et les pré-microARN afin d’obtenir des petits ARN interférant et des microARN. Ces fragments ont une longueur d’environ 25 paires de bases et la coupure laisse une extrémité cohésive 3’ débordante de deux bases.
3'-UTRLa région 3' non traduite, ou 3'-UTR (de anglais, three prime Untranslated Transcribed Region) est la partie de l’ARN messager (ARNm) qui suit le codon STOP (à l'extrémité 3'). Une molécule d’ARNm est transcrite à partir de la séquence d’ADN pour être traduite plus tard en protéine. Plusieurs parties de l’ARNm ne sont pas traduites en protéine, dont la coiffe ou 5'-cap, les régions 5'-UTR et 3'-UTR et la queue poly(A). La partie 3'-UTR contient souvent des régions qui influencent l’expression des gènes après la transcription.
Acide ribonucléique de transfertLes acides ribonucléiques de transfert, ou ARN de transfert ou ARNt, sont de courts ARN, longs de 75 à 95 nucléotides, qui interviennent lors de la synthèse des protéines dans la cellule. Ce sont des intermédiaires clés dans la traduction du message génétique et dans la lecture du code génétique. Ils apportent les acides aminés au ribosome, la machine cellulaire responsable de l'assemblage des protéines à partir de l'information génétique contenue dans l'ARN messager.
Région non traduiteLes régions non traduites, ou régions UTR (untranslated regions en anglais), sont les parties de l'ARNm issues de la transcription de l'ADN qui ne sont pas traduites en protéines. On distingue les régions 5'-UTR (contenant par exemple la coiffe chez les eucaryotes) et 3'-UTR, respectivement du côté 5' et 3' de l'ARNm. Les régions UTR — que l'on retrouve tant chez les eucaryotes que chez les procaryotes, virus inclus — ont une grande importance dans la régulation de l'expression d'un gène.
Interférence par ARNUn ARN interférent est un acide ribonucléique (ARN) simple ou double brin dont l'interférence avec un ARN messager spécifique conduit à sa dégradation et à la diminution de sa traduction en protéine. Dans la mesure où l'ARN joue un rôle crucial dans l'expression des gènes, l'ARN interférent permet de bloquer celle-ci en rendant « silencieux » tel ou tel gène. Ce phénomène a été découvert dans les années 1990, valant à Andrew Z. Fire et Craig C. Mello le prix Nobel de physiologie et de médecine en 2006.
Cadre de lecture ouvertvignette|Échantillon En génétique moléculaire, un cadre de lecture ouvert, ou phase ouverte de lecture (open reading frame ou ORF en anglais), est une partie d'un cadre de lecture susceptible d'être traduit en protéine ou en peptide. C'est une suite de codons comprenant le codon start et un codon stop, généralement UAA, UAG ou UGA. Un codon d'initiation AUG du cadre de lecture ouvert — codon qui n'est pas nécessairement le premier de celui-ci — peut indiquer le début de la traduction.