Ensemblest un système bio-informatique d'annotation automatique de génomes. C'est un projet conjoint de l'European Bioinformatics Institute (EBI) et du Wellcome Trust Sanger Institute dont l'idée centrale est d'organiser de vastes champs d'information biologique autour de séquences génomiques. Pour chaque génome analysé, Ensembl tente d'identifier par un processus automatique l'ensemble des gènes qu'il contient. Il s'appuie pour cela sur des données de séquences existantes (ARN, protéines), qu'il « raccroche » sur le génome, pour en déduire la structure des gènes.
Clustered Regularly Interspaced Short Palindromic Repeatsvignette|368x368px|CRISPR/Cas9. thumb|500px|right|Diagramme du mécanisme de CRISPR. En génétique, les , plus fréquemment désignées sous le nom de CRISPR (acronyme prononcé ), sont des familles de séquences répétées dans l'ADN. De telles familles se caractérisent par des séries de répétitions directes courtes (de 21 à 37 paires de bases) et régulièrement espacées par des séquences appelées , généralement uniques, de 20 à 40 paires de bases.
Genome evolutionGenome evolution is the process by which a genome changes in structure (sequence) or size over time. The study of genome evolution involves multiple fields such as structural analysis of the genome, the study of genomic parasites, gene and ancient genome duplications, polyploidy, and comparative genomics. Genome evolution is a constantly changing and evolving field due to the steadily growing number of sequenced genomes, both prokaryotic and eukaryotic, available to the scientific community and the public at large.
Prédiction de gènesEn bio-informatique, la prédiction de gènes consiste à identifier les zones de l'ADN qui correspondent à des gènes (le reste étant non codant). Les méthodes par similitudes, aussi appelées méthodes par homologie ou méthodes extrinsèques, consistent à utiliser des informations extérieures au génome pour trouver les gènes. Plus précisément, ces méthodes consistent à comparer la séquence étudiée avec des séquences connues, rassemblées dans les bases de données.
Étude d'association pangénomiqueUne étude d'association pangénomique (en anglais genome-wide association study, GWAS) est une analyse de nombreuses variations génétiques chez de nombreux individus, afin d'étudier leurs corrélations avec des traits phénotypiques. Ces études se concentrent généralement sur les associations entre les polymorphismes nucléotidiques (SNP) et des phénotypes tels que les maladies humaines majeures. En effet, quand elle est appliquée sur des données humaines, une comparaison de séquences d’ADN se fait entre individus ayant plusieurs phénotypes différents pour un même caractère, la taille par exemple.
C-valueC-value is the amount, in picograms, of DNA contained within a haploid nucleus (e.g. a gamete) or one half the amount in a diploid somatic cell of a eukaryotic organism. In some cases (notably among diploid organisms), the terms C-value and genome size are used interchangeably; however, in polyploids the C-value may represent two or more genomes contained within the same nucleus. Greilhuber et al. have suggested some new layers of terminology and associated abbreviations to clarify this issue, but these somewhat complex additions are yet to be used by other authors.
Taille du génomevignette|Arbre phylogénétique indiquant la taille des génomes chez les organismes des trois domaines du monde vivant: les bactéries Bacteria (en bleu), les archées Archaea (en vert) et les eucaryotes Eucarya (en rouge). La taille du génome correspond à la quantité d'ADN contenue dans une copie d'un génome. La taille d'un génome est également appelée valeur C.
Interférence par ARNUn ARN interférent est un acide ribonucléique (ARN) simple ou double brin dont l'interférence avec un ARN messager spécifique conduit à sa dégradation et à la diminution de sa traduction en protéine. Dans la mesure où l'ARN joue un rôle crucial dans l'expression des gènes, l'ARN interférent permet de bloquer celle-ci en rendant « silencieux » tel ou tel gène. Ce phénomène a été découvert dans les années 1990, valant à Andrew Z. Fire et Craig C. Mello le prix Nobel de physiologie et de médecine en 2006.
Variabilité du nombre de copiesLa variabilité du nombre de copies d'un gène (en anglais copy number variation, CNV) désigne en génétique une forme particulière de polymorphisme dans lequel le nombre de copies d'un même gène ou d'un segment chromosomique dans le génome est variable entre les individus de la même espèce. La présence de plusieurs copies de même gènes dans le génome est due à des événements de duplication de gènes, qui peuvent affecter un gène, quelques gènes, ou l'intégralité du génome.
GénomiqueLa génomique est une discipline de la biologie moderne. Elle étudie le fonctionnement d'un organisme, d'un organe, d'un cancer, etc. à l'échelle du génome, au lieu de se limiter à l'échelle d'un seul gène. La génomique se divise en deux branches : La génomique structurale, qui se charge du séquençage du génome entier ; La génomique fonctionnelle, qui vise à déterminer la fonction et l'expression des gènes séquencés en caractérisant le transcriptome et le protéome. La génomique est l'équivalent de la métabolomique pour les métabolites.