vignette|upright=2.2|Schéma simplifié du mécanisme d'un activateur. Un facteur de transcription est une protéine nécessaire à l'initiation ou à la régulation de la transcription d'un gène dans l'ensemble du vivant (procaryote ou eucaryote). Elle interagit avec l'ADN et l'ARN-polymérase. Il existe une classification complexe des facteurs de transcription. Les facteurs généraux de la transcription, impliqués dans la composition de la machinerie transcriptionnelle basale organisée autour de l'ARN polymérase II.
Un promoteur, ou séquence promotrice, est une région de l'ADN située à proximité d'un gène et indispensable à la transcription de l'ADN en ARN. Le promoteur est la zone de l'ADN sur laquelle se fixe initialement l'ARN polymérase, avant de démarrer la synthèse de l'ARN. Les séquences promotrices sont en général situées en amont du site de démarrage de la transcription. Un promoteur est aussi constitué de plusieurs séquences régulatrices de l'expression du gène, soit spécifiques à un tissu ou groupe de tissus, soit ubiquitaires, c'est-à-dire les mêmes pour tous les tissus.
Les projets de séquençage de génome sont des projets scientifiques qui ont pour but d'obtenir les séquences complètes des génomes de différents organismes: bactéries, plantes, champignons, animaux, et humain. Ce travail nécessite la séquence de l'ADN de chacun des chromosomes de l'espèce. Pour une bactérie, il n'y a qu'un chromosome à séquencer. Pour l'espèce humaine, qui possède 22 paires de chromosomes et 2 chromosomes sexuels (X et Y), il y a 24 chromosomes à séquencer. Le projet génome humain est abouti depuis 2003.
Le génome (//), ou plus rarement génôme, est l'ensemble du matériel génétique d'une espèce codé dans son acide désoxyribonucléique (ADN), à l'exception de certains virus dont le génome est constitué d'acide ribonucléique (ARN). Il contient en particulier tous les gènes codant des protéines ou correspondant à des ARN structurés. Il se décompose donc en séquences codantes (transcrites en ARN messagers et traduites en protéines) et non codantes (non transcrites, ou transcrites en ARN, mais non traduites).
En génétique, un activateur transcriptionnel, ou, plus simplement, activateur, est une protéine ou une autre molécule qui stimule la transcription d'un gène ou d'un opéron. La plupart des activateurs sont des protéines de liaison à l'ADN qui se lient à des amplificateurs ou à des promoteurs. Ils reconnaissent généralement une séquence spécifique sur l'ADN située à proximité d'un promoteur et interagissent avec l'ARN polymérase et les facteurs de transcription pour en faciliter la liaison à ce dernier.
En biologie moléculaire, la transcription est la première étape de l'expression génique basée sur l'ADN, au cours de laquelle un segment particulier d'ADN est « copié » en ARN par une enzyme appelée ARN polymérase. Chez les eucaryotes, la transcription se déroule dans le noyau des cellules. Certains types d'ARN appélés « ARN non codants » n'ont pas vocation à être traduits en protéines et peuvent jouer un rôle régulateur ou structurel (par exemple les ARN ribosomiques).
La régulation de la transcription est la phase du contrôle de l'expression des gènes agissant au niveau de la transcription de l'ADN. Cette régulation modifiera la quantité d'ARN produit. Cette régulation est principalement effectuée par la modulation du taux de transcription par l'intervention de facteurs de transcription qui se classent en deux catégories : les éléments cis-regulateurs géniques, en coopération avec les facteurs transprotéiques. Il existe également des mécanismes de régulation de la terminaison de la transcription.
The human genome is a complete set of nucleic acid sequences for humans, encoded as DNA within the 23 chromosome pairs in cell nuclei and in a small DNA molecule found within individual mitochondria. These are usually treated separately as the nuclear genome and the mitochondrial genome. Human genomes include both protein-coding DNA sequences and various types of DNA that does not encode proteins. The latter is a diverse category that includes DNA coding for non-translated RNA, such as that for ribosomal RNA, transfer RNA, ribozymes, small nuclear RNAs, and several types of regulatory RNAs.
Whole genome sequencing (WGS), also known as full genome sequencing, complete genome sequencing, or entire genome sequencing, is the process of determining the entirety, or nearly the entirety, of the DNA sequence of an organism's genome at a single time. This entails sequencing all of an organism's chromosomal DNA as well as DNA contained in the mitochondria and, for plants, in the chloroplast. Whole genome sequencing has largely been used as a research tool, but was being introduced to clinics in 2014.
A reference genome (also known as a reference assembly) is a digital nucleic acid sequence database, assembled by scientists as a representative example of the set of genes in one idealized individual organism of a species. As they are assembled from the sequencing of DNA from a number of individual donors, reference genomes do not accurately represent the set of genes of any single individual organism. Instead a reference provides a haploid mosaic of different DNA sequences from each donor.