GèneUn gène, du grec ancien (« génération, naissance, origine »), est, en biologie, une séquence discrète et héritable de nucléotides dont l'expression affecte les caractères d'un organisme. L'ensemble des gènes et du matériel non codant d'un organisme constitue son génome. Un gène possède donc une position donnée dans le génome d'une espèce, on parle de locus génique. La séquence est généralement formée par des désoxyribonucléotides, et est donc une séquence d'ADN (par des ribonucléotides formant de l'ARN dans le cas de certains virus), au sein d'un chromosome.
Cadre de lectureredresse=1.5|vignette|Exemple de cadres de lecture dans un segment d'ADN : AGG·TGA·CAC·CGC·AAG·CCT·TAT·ATT·AGCA·GGT·GAC·ACC·GCA·AGC·CTT·ATA·TTA·GCAG·GTG·ACA·CCG·CAA·GCC·TTA·TAT·TAG·C En biologie moléculaire, un cadre de lecture est un mode de regroupement des nucléotides constituant la séquence d'un acide nucléique — ADN et ARN — en triplets consécutifs, qui se succèdent sans interruption ni recouvrement. Lorsque ces triplets encodent des acides aminés ou la fin de la traduction génétique, ils sont appelés codons.
Séquence codantevignette|Schéma simplifié du dogme central de la biologie moléculaire. Certaines séquences d'ADN subissent une transcription afin de générer un ARN messager primaire. Cet ARNm subit différentes transformations, notamment l'épissage, par lequel les introns sont enlevés, pour générer un transcrit mature. Finalement, les ribosomes traduisent la séquence codante en protéine. La séquence codante est indiquée en vert.
Frameshift mutationA frameshift mutation (also called a framing error or a reading frame shift) is a genetic mutation caused by indels (insertions or deletions) of a number of nucleotides in a DNA sequence that is not divisible by three. Due to the triplet nature of gene expression by codons, the insertion or deletion can change the reading frame (the grouping of the codons), resulting in a completely different translation from the original. The earlier in the sequence the deletion or insertion occurs, the more altered the protein.
ProkaryotaUn procaryote est un micro-organisme unicellulaire dont la structure cellulaire ne comporte pas de noyau, et presque jamais d'organites membranés (la seule exception étant les thylakoïdes chez les cyanobactéries). Les procaryotes actuels sont les bactéries et les archées. Les Prokaryota ne constituent pas un taxon valide du point de vue de la phylogénie. Dans la classification du vivant en sept règnes, les procaryotes formaient un taxon paraphylétique, regroupant ainsi des êtres vivants partageant une structure cellulaire similaire et simple.
Puce à ADNthumb|upright=1.2|Principe d'utilisation de la puce à ADN. Une puce à ADN est un ensemble de molécules d'ADN fixées en rangées ordonnées sur une petite surface qui peut être du verre, du silicium ou du plastique. Cette biotechnologie récente permet d'analyser le niveau d'expression des gènes (transcrits) dans une cellule, un tissu, un organe, un organisme ou encore un mélange complexe, à un moment donné et dans un état donné par rapport à un échantillon de référence.
Codon-stop220px|vignette|Les trois codons qui arrêtent la traduction d'une séquence codant une protéine|alt= Les trois codons qui arrêtent la traduction de l'ARN messager Un codon-stop, codon de terminaison ou encore codon non-sens est l'un des trois codons (parmi les 64 codons du code génétique) qui marquent la fin de la traduction d'un ARNm en protéine. Il n'est en général jamais traduit car il n'existe pas d'ARN de transfert correspondant.
Région non traduiteLes régions non traduites, ou régions UTR (untranslated regions en anglais), sont les parties de l'ARNm issues de la transcription de l'ADN qui ne sont pas traduites en protéines. On distingue les régions 5'-UTR (contenant par exemple la coiffe chez les eucaryotes) et 3'-UTR, respectivement du côté 5' et 3' de l'ARNm. Les régions UTR — que l'on retrouve tant chez les eucaryotes que chez les procaryotes, virus inclus — ont une grande importance dans la régulation de l'expression d'un gène.
National Center for Biotechnology InformationLe National Center for Biotechnology Information (NCBI, en français littéralement « Centre américain pour les informations biotechnologiques ») est un institut national américain pour l'information biologique moléculaire. Cet organisme, fondé en 1988 et situé à Bethesda dans le Maryland, fait partie de la Bibliothèque américaine de médecine, un des Instituts américains de la santé. Le NCBI conduit des recherches dans la biologie informatique, développe des logiciels pour analyser des données de génome et fournir des informations biomédicales.
Polymorphisme nucléotidiquevignette|La molécule d'ADN 1 diffère de la 2 par un seul nucléotide (polymorphisme C/T). Le polymorphisme nucléotidique (PN, ou polymorphisme d'un seul nucléotide, PSN ; single nucleotide polymorphism, SNP) est, en génétique, la variation (polymorphisme) d'une seule paire de bases du génome entre individus d'une même espèce, ou entre un individu et la séquence de référence de l'espèce. La variation doit être située à un endroit spécifique du génome et apparaître sur une proportion supérieure à 1 % de la population pour être caractérisée comme PSN.