Human genomeThe human genome is a complete set of nucleic acid sequences for humans, encoded as DNA within the 23 chromosome pairs in cell nuclei and in a small DNA molecule found within individual mitochondria. These are usually treated separately as the nuclear genome and the mitochondrial genome. Human genomes include both protein-coding DNA sequences and various types of DNA that does not encode proteins. The latter is a diverse category that includes DNA coding for non-translated RNA, such as that for ribosomal RNA, transfer RNA, ribozymes, small nuclear RNAs, and several types of regulatory RNAs.
Projet de séquençage de génomeLes projets de séquençage de génome sont des projets scientifiques qui ont pour but d'obtenir les séquences complètes des génomes de différents organismes: bactéries, plantes, champignons, animaux, et humain. Ce travail nécessite la séquence de l'ADN de chacun des chromosomes de l'espèce. Pour une bactérie, il n'y a qu'un chromosome à séquencer. Pour l'espèce humaine, qui possède 22 paires de chromosomes et 2 chromosomes sexuels (X et Y), il y a 24 chromosomes à séquencer. Le projet génome humain est abouti depuis 2003.
Traitement de donnéesEn informatique, le terme traitement de données ou traitement électronique des données renvoie à une série de processus qui permettent d'extraire de l'information ou de produire du savoir à partir de données brutes. Ces processus, une fois programmés, sont le plus souvent automatisés à l'aide d'ordinateurs. Si les résultats finaux produits par ces processus sont destinés à des humains, leur présentation est souvent essentielle pour en apprécier la valeur. Cette appréciation est cependant variable selon les personnes.
Espècevignette| redresse=1.2| L'espèce est l'unité de base de la classification du vivant. Dans les sciences du vivant, l’espèce (du latin species, « type » ou « apparence ») est le taxon de base de la systématique. La définition la plus communément admise est celle du concept biologique : une espèce est un ensemble d'individus qui peuvent effectivement ou potentiellement se reproduire entre eux et engendrer une descendance viable et féconde, dans des conditions naturelles.
Inférence bayésienne en phylogénieL'inférence bayésienne de la phylogénie est la combinaison des informations dans l'a priori et dans la vraisemblance des données pour créer la soi-disant probabilité postérieure des arbres, qui est la probabilité que l'arbre soit correct compte tenu des données, de l'a priori et du modèle de vraisemblance. L'inférence bayésienne a été introduite dans la phylogénétique moléculaire dans les années 1990 par trois groupes indépendants : Bruce Rannala et Ziheng Yang à Berkeley, Bob Mau à Madison, et Shuying Li à l'Université de l'Iowa, les deux derniers étant doctorants à l'époque.
Analyse des donnéesL’analyse des données (aussi appelée analyse exploratoire des données ou AED) est une famille de méthodes statistiques dont les principales caractéristiques sont d'être multidimensionnelles et descriptives. Dans l'acception française, la terminologie « analyse des données » désigne donc un sous-ensemble de ce qui est appelé plus généralement la statistique multivariée. Certaines méthodes, pour la plupart géométriques, aident à faire ressortir les relations pouvant exister entre les différentes données et à en tirer une information statistique qui permet de décrire de façon plus succincte les principales informations contenues dans ces données.
Régulation de la transcriptionLa régulation de la transcription est la phase du contrôle de l'expression des gènes agissant au niveau de la transcription de l'ADN. Cette régulation modifiera la quantité d'ARN produit. Cette régulation est principalement effectuée par la modulation du taux de transcription par l'intervention de facteurs de transcription qui se classent en deux catégories : les éléments cis-regulateurs géniques, en coopération avec les facteurs transprotéiques. Il existe également des mécanismes de régulation de la terminaison de la transcription.
Taille du génomevignette|Arbre phylogénétique indiquant la taille des génomes chez les organismes des trois domaines du monde vivant: les bactéries Bacteria (en bleu), les archées Archaea (en vert) et les eucaryotes Eucarya (en rouge). La taille du génome correspond à la quantité d'ADN contenue dans une copie d'un génome. La taille d'un génome est également appelée valeur C.
Différenciation cellulaireLa différenciation cellulaire est un concept de biologie du développement décrivant le processus par lequel les cellules se spécialisent en un « type » cellulaire avec une structure et une composition spécifiques permettant d'accomplir une ou plusieurs fonctions particulières. La morphologie d'une cellule peut changer radicalement durant la différenciation, mais le matériel génétique reste le même, à quelques exceptions près. Une cellule capable de se différencier en plusieurs types de cellules est appelée pluripotente.
Projet Génome humainvignette|Le génome humain est constitué de l'ensemble de l'information portée par nos 23 paires de chromosomes. Le (PGH, ou HGP pour l'anglais Human Genome Project) est un programme lancé fin 1988 dont la mission était d'établir le séquençage complet de l'ADN du génome humain. Son achèvement a été annoncé le . Le nouveau projet lancé dans la foulée en , ENCODE (Encyclopedia of DNA Elements), donne des résultats importants sur l'ADN non codant humain.