Ensemblest un système bio-informatique d'annotation automatique de génomes. C'est un projet conjoint de l'European Bioinformatics Institute (EBI) et du Wellcome Trust Sanger Institute dont l'idée centrale est d'organiser de vastes champs d'information biologique autour de séquences génomiques. Pour chaque génome analysé, Ensembl tente d'identifier par un processus automatique l'ensemble des gènes qu'il contient. Il s'appuie pour cela sur des données de séquences existantes (ARN, protéines), qu'il « raccroche » sur le génome, pour en déduire la structure des gènes.
Whole genome sequencingWhole genome sequencing (WGS), also known as full genome sequencing, complete genome sequencing, or entire genome sequencing, is the process of determining the entirety, or nearly the entirety, of the DNA sequence of an organism's genome at a single time. This entails sequencing all of an organism's chromosomal DNA as well as DNA contained in the mitochondria and, for plants, in the chloroplast. Whole genome sequencing has largely been used as a research tool, but was being introduced to clinics in 2014.
Cartographie génétiquealt=Genetic Difference|vignette|Cartographie génétique du monde selon les légères différences de locus La cartographie génétique est la construction d’une carte soit localisée autour d’un gène, soit à base large portant sur le génome entier. Plus généralement, c’est la détermination de la position d’un locus (gène ou marqueur génétique) sur un chromosome en fonction du taux de recombinaison génétique. Son unité de distance est le centimorgan (cM).
Sequence analysisIn bioinformatics, sequence analysis is the process of subjecting a DNA, RNA or peptide sequence to any of a wide range of analytical methods to understand its features, function, structure, or evolution. Methodologies used include sequence alignment, searches against biological databases, and others. Since the development of methods of high-throughput production of gene and protein sequences, the rate of addition of new sequences to the databases increased very rapidly.
Polymorphisme nucléotidiquevignette|La molécule d'ADN 1 diffère de la 2 par un seul nucléotide (polymorphisme C/T). Le polymorphisme nucléotidique (PN, ou polymorphisme d'un seul nucléotide, PSN ; single nucleotide polymorphism, SNP) est, en génétique, la variation (polymorphisme) d'une seule paire de bases du génome entre individus d'une même espèce, ou entre un individu et la séquence de référence de l'espèce. La variation doit être située à un endroit spécifique du génome et apparaître sur une proportion supérieure à 1 % de la population pour être caractérisée comme PSN.
Chromosome 22 humaindroite Le chromosome 22 appartient à l'une des de chromosomes humains. C'est l'un des et l'un des cinq chromosomes acrocentriques : tous ses gênes sont localisés sur son bras long (q). Ce chromosome a été déchiffré en décembre 1999. Nombre de paires de base : Nombre de gènes : 552 Nombre de gènes connus : 471 Nombre de pseudo gènes : 129 Nombre de variations des nucléotides (S.N.P ou single nucleotide polymorphisme) : On peut noter, qu'alors que les autosomes sont numérotés par taille décroissante, le chromosome 22 est en fait un peu plus grand que le chromosome 21 humain.
Projet de séquençage de génomeLes projets de séquençage de génome sont des projets scientifiques qui ont pour but d'obtenir les séquences complètes des génomes de différents organismes: bactéries, plantes, champignons, animaux, et humain. Ce travail nécessite la séquence de l'ADN de chacun des chromosomes de l'espèce. Pour une bactérie, il n'y a qu'un chromosome à séquencer. Pour l'espèce humaine, qui possède 22 paires de chromosomes et 2 chromosomes sexuels (X et Y), il y a 24 chromosomes à séquencer. Le projet génome humain est abouti depuis 2003.
Séquençage shotgunEn génétique, le séquençage shotgun (littéralement séquençage "fusil de chasse") est une méthode utilisée pour séquencer des brins d'ADN aléatoires. On l'appelle ainsi par analogie avec le modèle de tir quasi-aléatoire en pleine expansion d'un fusil de chasse : cette métaphore illustre le caractère aléatoire de la fragmentation initiale de l'ADN génomique où l'on "arrose" tout le génome, un peu comme se dispersent les plombs de ce type d'arme à feu.
GenBankLa GenBank est une base de données de la séquences d'ADN, comprenant toutes les séquences de nucléotides publiquement disponibles et leur traduction en protéines. Cette base de données américaine « Nucleotide », en libre accès, a été créée au Centre national pour l'information biotechnologique (NCBI) dans le cadre de la collaboration internationale sur le séquençage des nucléotides (INSDC selon le sigle anglais). La GenBank et ses collaborateurs reçoivent des séquences produites dans des laboratoires du monde entier à partir de plus de organismes différents.
BiologieLa biologie (du grec bios « la vie » et logos, « discours ») est la science du vivant. Elle recouvre une partie des sciences de la nature et de l'histoire naturelle des êtres vivants. La vie se présentant sous de nombreuses formes et à des échelles très différentes, la biologie s'étend du niveau moléculaire, à celui de la cellule, puis de l'organisme, jusqu'au niveau de la population et de l'écosystème. vignette|Portrait de Jean-Baptiste Lamarck, 1893.