Un gène, du grec ancien (« génération, naissance, origine »), est, en biologie, une séquence discrète et héritable de nucléotides dont l'expression affecte les caractères d'un organisme. L'ensemble des gènes et du matériel non codant d'un organisme constitue son génome. Un gène possède donc une position donnée dans le génome d'une espèce, on parle de locus génique. La séquence est généralement formée par des désoxyribonucléotides, et est donc une séquence d'ADN (par des ribonucléotides formant de l'ARN dans le cas de certains virus), au sein d'un chromosome.
Cis-regulatory elements (CREs) or Cis''-regulatory modules (CRMs) are regions of non-coding DNA which regulate the transcription of neighboring genes. CREs are vital components of genetic regulatory networks, which in turn control morphogenesis, the development of anatomy, and other aspects of embryonic development, studied in evolutionary developmental biology. CREs are found in the vicinity of the genes that they regulate. CREs typically regulate gene transcription by binding to transcription factors.
La boîte TATA (TATA box ou Goldberg-Hogness box en anglais) est une séquence d'ADN (un élément cis-régulateur) présente au niveau de la séquence promotrice d'une partie des gènes des eucaryotes . Cette séquence d'ADN codée TATA se situe à environ 25 nucléotides en amont du premier nucléotide transcrit (N+1). Cette séquence sert en partie de lieu de reconnaissance à l'ARN polymérase chez les eucaryotes. Chez les procaryotes, il existe aussi un autre ensemble de séquence jouant un rôle similaire.
Un inactivateur (en anglais silencer) est une région d'ADN (séquence régulatrice) qui peut fixer des protéines pour diminuer la transcription de gène. Un gène peut posséder plusieurs amplificateurs. Ils sont généralement situés à assez loin du gène (jusqu'à nucléotides). Ou encore le gène et l'amplificateur ne sont pas forcément proches l'un de l'autre et peuvent même être sur deux chromosomes différents mais par contre le repliement de l'ADN dans le noyau leur permet une proximité physique.
vignette|250px En génétique moléculaire, les éléments isolateurs sont des séquences d'ADN qui se trouvent parfois entre deux gènes ou groupes de gènes, les protégeant ainsi des effets produits par les autres séquences régulatrices. Ces éléments agissent en tant que barrières génétiques empêchant les interactions entre les éléments enhancer/amplificateur et promoteur. Un isolateur doit résider entre un enhancer et promoteur afin d'inhiber leurs interactions ultérieures.
En biologie moléculaire et en bioinformatique, une séquence consensus est la séquence nucléotidique ou la séquence peptidique la plus fréquente à chaque position d'un alignement de séquences. Elle représente le résultat d'alignements de séquences multiples dans lesquelles les séquences apparentées sont comparées les unes aux autres afin de déterminer les motifs les plus fréquents. Cette information est importante pour les protéines dépendantes des séquences nucléotidiques, telles que les ARN polymérases.
redresse=1.25|vignette|Structure 3D du riborégulateur fixant la Un riboswitch est un des systèmes de type riborégulateur. Il s'agit d'une structure d'ARN présente sur la partie amont (en 5'), non traduite, de certains ARN messagers. Un riboswitch comporte deux parties : l'aptamère (simple ou en tandem) et la plateforme d'expression. L'aptamère peut lier directement un ligand (une petite molécule) ce qui déclenche une modification de structure de la plateforme d'expression.
La génomique comparative est l'étude comparative de la structure en fonction des génomes de différentes espèces. Elle permet d'identifier et de comprendre les effets de la sélection sur l'organisation et l'évolution des génomes. Ce nouvel axe de recherche bénéficie de l'augmentation du nombre de génomes séquencés et de la puissance des outils informatiques. Une des applications majeures de la génomique comparative est la découverte de gènes et de leurs séquences régulatrices non codantes basée sur le principe de conservation.
The human genome is a complete set of nucleic acid sequences for humans, encoded as DNA within the 23 chromosome pairs in cell nuclei and in a small DNA molecule found within individual mitochondria. These are usually treated separately as the nuclear genome and the mitochondrial genome. Human genomes include both protein-coding DNA sequences and various types of DNA that does not encode proteins. The latter is a diverse category that includes DNA coding for non-translated RNA, such as that for ribosomal RNA, transfer RNA, ribozymes, small nuclear RNAs, and several types of regulatory RNAs.
Gene structure is the organisation of specialised sequence elements within a gene. Genes contain most of the information necessary for living cells to survive and reproduce. In most organisms, genes are made of DNA, where the particular DNA sequence determines the function of the gene. A gene is transcribed (copied) from DNA into RNA, which can either be non-coding (ncRNA) with a direct function, or an intermediate messenger (mRNA) that is then translated into protein.