GèneUn gène, du grec ancien (« génération, naissance, origine »), est, en biologie, une séquence discrète et héritable de nucléotides dont l'expression affecte les caractères d'un organisme. L'ensemble des gènes et du matériel non codant d'un organisme constitue son génome. Un gène possède donc une position donnée dans le génome d'une espèce, on parle de locus génique. La séquence est généralement formée par des désoxyribonucléotides, et est donc une séquence d'ADN (par des ribonucléotides formant de l'ARN dans le cas de certains virus), au sein d'un chromosome.
Polymorphisme nucléotidiquevignette|La molécule d'ADN 1 diffère de la 2 par un seul nucléotide (polymorphisme C/T). Le polymorphisme nucléotidique (PN, ou polymorphisme d'un seul nucléotide, PSN ; single nucleotide polymorphism, SNP) est, en génétique, la variation (polymorphisme) d'une seule paire de bases du génome entre individus d'une même espèce, ou entre un individu et la séquence de référence de l'espèce. La variation doit être située à un endroit spécifique du génome et apparaître sur une proportion supérieure à 1 % de la population pour être caractérisée comme PSN.
Frameshift mutationA frameshift mutation (also called a framing error or a reading frame shift) is a genetic mutation caused by indels (insertions or deletions) of a number of nucleotides in a DNA sequence that is not divisible by three. Due to the triplet nature of gene expression by codons, the insertion or deletion can change the reading frame (the grouping of the codons), resulting in a completely different translation from the original. The earlier in the sequence the deletion or insertion occurs, the more altered the protein.
Cadre de lecture ouvertvignette|Échantillon En génétique moléculaire, un cadre de lecture ouvert, ou phase ouverte de lecture (open reading frame ou ORF en anglais), est une partie d'un cadre de lecture susceptible d'être traduit en protéine ou en peptide. C'est une suite de codons comprenant le codon start et un codon stop, généralement UAA, UAG ou UGA. Un codon d'initiation AUG du cadre de lecture ouvert — codon qui n'est pas nécessairement le premier de celui-ci — peut indiquer le début de la traduction.
Gène chevauchantEn génétique, un gène est dit chevauchant s'il est superposé, partiellement ou totalement, à un autre gène et exprime une protéine différente de ce dernier. Il peut s'agir de séquences codantes superposées transcrites avec un décalage du cadre de lecture, de l'expression du brin d'ADN complémentaire de la région codante d'un autre gène, de gènes exprimés chacun sur un brin d'ADN complémentaire et qui ne se superposent qu'à leur extrémité 3', voire d'un gène inclus dans l'intron d'un autre gène.
Alignement de séquencesEn bio-informatique, l'alignement de séquences (ou alignement séquentiel) est une manière de représenter deux ou plusieurs séquences de macromolécules biologiques (ADN, ARN ou protéines) les unes sous les autres, de manière à en faire ressortir les régions homologues ou similaires. L'objectif de l'alignement est de disposer les composants (nucléotides ou acides aminés) pour identifier les zones de concordance. Ces alignements sont réalisés par des programmes informatiques dont l'objectif est de maximiser le nombre de coïncidences entre nucléotides ou acides aminés dans les différentes séquences.
MutagèneEn biologie, un mutagène (du latin, littéralement origine de changement) est un agent qui change le génome (en général l'ADN) d'un organisme et élève ainsi le nombre de mutations génétiques au-dessus du taux naturel d'arrière-plan. Les mutagènes sont en général des composés chimiques ou des radiations. Les mutations, en dehors de celles qui affectent les cellules reproductives, ne sont pas inoffensives. Si elles n'induisent pas toutes des cancers, c'est la première étape nécessaire vers la cancérisation.
Human genomeThe human genome is a complete set of nucleic acid sequences for humans, encoded as DNA within the 23 chromosome pairs in cell nuclei and in a small DNA molecule found within individual mitochondria. These are usually treated separately as the nuclear genome and the mitochondrial genome. Human genomes include both protein-coding DNA sequences and various types of DNA that does not encode proteins. The latter is a diverse category that includes DNA coding for non-translated RNA, such as that for ribosomal RNA, transfer RNA, ribozymes, small nuclear RNAs, and several types of regulatory RNAs.
Insertion (génétique)L'insertion est une mutation génétique caractérisée par l'enchâssement de matériel génétique dans un chromosome. La taille d'insertion varie entre une paire de bases et tout un secteur d'un chromosome déplacé vers un autre. Dans ce dernier cas, une partie des données génétiques du premier chromosome est effacée. Ceci peut arriver lors d'un enjambement inégal L'enchâssement de bases nucléiques dans un gène le rend plus long et décale la lecture de ses données, ce qui peut modifier son fonctionnement d'une manière nocive, surtout si l'insertion survient sur l'exon (les fragments d’un ARN primaire présents dans l’ARN cytoplasmique après épissage).
3'-UTRLa région 3' non traduite, ou 3'-UTR (de anglais, three prime Untranslated Transcribed Region) est la partie de l’ARN messager (ARNm) qui suit le codon STOP (à l'extrémité 3'). Une molécule d’ARNm est transcrite à partir de la séquence d’ADN pour être traduite plus tard en protéine. Plusieurs parties de l’ARNm ne sont pas traduites en protéine, dont la coiffe ou 5'-cap, les régions 5'-UTR et 3'-UTR et la queue poly(A). La partie 3'-UTR contient souvent des régions qui influencent l’expression des gènes après la transcription.