Structure primairevignette|Structure des protéines, en particulier la structure primaire En biochimie, la structure primaire d'une biomolécule non-ramifiée comme une protéine ou un brin d'ADN ou d'ARN, est la séquence de nucléotides ou d'acides aminés du début à la fin de la molécule. Autrement dit, la structure primaire représente l'exacte composition chimique et la séquence de ses sous-unités monomériques. La structure primaire d'un polymère biologique détermine largement sa forme tridimensionnelle, connue sous le nom de structure tertiaire.
Inférence bayésienne en phylogénieL'inférence bayésienne de la phylogénie est la combinaison des informations dans l'a priori et dans la vraisemblance des données pour créer la soi-disant probabilité postérieure des arbres, qui est la probabilité que l'arbre soit correct compte tenu des données, de l'a priori et du modèle de vraisemblance. L'inférence bayésienne a été introduite dans la phylogénétique moléculaire dans les années 1990 par trois groupes indépendants : Bruce Rannala et Ziheng Yang à Berkeley, Bob Mau à Madison, et Shuying Li à l'Université de l'Iowa, les deux derniers étant doctorants à l'époque.
Classification phylogénétiqueLa classification phylogénétique ou classification cladistique est une forme de classification des êtres vivants qui repose sur leur phylogénie. Elle prend son origine dans les travaux d'une école de taxonomie dite systématique phylogénétique ou systématique cladistique ou cladisme. Cette approche a pour objectif de rendre compte des relations de parenté entre les taxons, s’agissant seulement de l'apparentement, c'est-à-dire des relations de groupes frères et non des relations généalogiques d'ancêtres à descendants, entre des groupes d'organismes quel que soit leur rang taxonomique.
Information mutuelleDans la théorie des probabilités et la théorie de l'information, l'information mutuelle de deux variables aléatoires est une quantité mesurant la dépendance statistique de ces variables. Elle se mesure souvent en bit. L'information mutuelle d'un couple de variables représente leur degré de dépendance au sens probabiliste. Ce concept de dépendance logique ne doit pas être confondu avec celui de causalité physique, bien qu'en pratique l'un implique souvent l'autre.
Séquençage des protéinesLe séquençage des protéines est la détermination de la séquence polypeptidique. Elle est destinée à connaître le nombre, la nature chimique et l'ordre de tous les résidus d'acides aminés dans un polypeptide. Pour cela, si la protéine contient plus d'une chaîne polypeptidique, les chaînes doivent être d'abord séparées, puis purifiées. Généralement, toutes les liaisons disulfures seront réduites et les thiols ainsi obtenus alkylés.
Recombinaison homologuethumb | 275px | alt=Schéma du chromosome 1 après recombinaison homologue | Figure 1. La recombinaison homologue peut produire de nouvelles combinaisons d'allèles entre les chromosomes parentaux, notamment lors de la méiose.La recombinaison homologue est un type de recombinaison génétique où les séquences de nucléotides sont échangées entre des molécules d'ADN identiques (homologues) ou similaires (Figure 1). Au sens large, la recombinaison homologue est un mécanisme ubiquitaire de réparation des cassures double-brins de l'ADN.
Super-famille de protéinesUne superfamille (ou super-famille) de protéines est le regroupement le plus large (clade) de protéines pour lesquelles il est possible d'identifier un ancêtre commun par homologie. Cet ancêtre commun est généralement déduit par et similitude mécanique, même lorsque aucune similitude entre les séquences n'est détectable. Les super-familles contiennent généralement plusieurs familles de protéines présentant des similitudes de séquences au sein de ces familles.
Séquence conservéeEn biologie de l'évolution, les séquences conservées sont des séquences d'acides nucléiques (ADN et ARN) ou d'acide aminés identiques ou similaires au sein d'un génome (on parle alors de séquences paralogues) ; à travers les espèces (on parle alors de séquences orthologues), ou bien encore entre un taxon donneur et un taxon récepteur (on parle alors de séquences xénologues). La conservation indique qu'une séquence a été maintenue par la sélection naturelle.
Structure des protéinesLa structure des protéines est la composition en acides aminés et la conformation en trois dimensions des protéines. Elle décrit la position relative des différents atomes qui composent une protéine donnée. Les protéines sont des macromolécules de la cellule, dont elles constituent la « boîte à outils », lui permettant de digérer sa nourriture, produire son énergie, de fabriquer ses constituants, de se déplacer, etc. Elles se composent d'un enchaînement linéaire d'acides aminés liés par des liaisons peptidiques.
Distance matrices in phylogenyDistance matrices are used in phylogeny as non-parametric distance methods and were originally applied to phenetic data using a matrix of pairwise distances. These distances are then reconciled to produce a tree (a phylogram, with informative branch lengths). The distance matrix can come from a number of different sources, including measured distance (for example from immunological studies) or morphometric analysis, various pairwise distance formulae (such as euclidean distance) applied to discrete morphological characters, or genetic distance from sequence, restriction fragment, or allozyme data.