Évolution moléculaireL'évolution moléculaire ou évolution du génome correspond à l'ensemble des modifications d ́un génome au cours de générations successives au sein d'une population. C'est le moteur de l'évolution des espèces. L ́étude de l ́évolution moléculaire des génomes tente d'expliquer les changements biologiques au niveau moléculaire et cellulaire. Ceci met en jeu plusieurs disciplines telles que la biologie moléculaire, la génétique, la génomique et la bio-informatique.
Similarity measureIn statistics and related fields, a similarity measure or similarity function or similarity metric is a real-valued function that quantifies the similarity between two objects. Although no single definition of a similarity exists, usually such measures are in some sense the inverse of distance metrics: they take on large values for similar objects and either zero or a negative value for very dissimilar objects. Though, in more broad terms, a similarity function may also satisfy metric axioms.
Horloge moléculaireEn génétique, l'hypothèse de l'horloge moléculaire est une hypothèse selon laquelle les mutations génétiques s'accumulent dans un génome à une vitesse constante. Elle permet ainsi théoriquement, en reliant le taux de mutation des gènes à la différence génétique entre espèces proches, d'établir une échelle chronologique approximative de la divergence de ces espèces. En 1962, Émile Zuckerkandl et Linus Pauling observent ce phénomène dans la partie du génome codant l'hémoglobine entre deux espèces données.
Point accepted mutationA point accepted mutation — also known as a PAM — is the replacement of a single amino acid in the primary structure of a protein with another single amino acid, which is accepted by the processes of natural selection. This definition does not include all point mutations in the DNA of an organism. In particular, silent mutations are not point accepted mutations, nor are mutations that are lethal or that are rejected by natural selection in other ways. A PAM matrix is a matrix where each column and row represents one of the twenty standard amino acids.
Sequential pattern miningSequential pattern mining is a topic of data mining concerned with finding statistically relevant patterns between data examples where the values are delivered in a sequence. It is usually presumed that the values are discrete, and thus time series mining is closely related, but usually considered a different activity. Sequential pattern mining is a special case of structured data mining. There are several key traditional computational problems addressed within this field.
Séquence consensusEn biologie moléculaire et en bioinformatique, une séquence consensus est la séquence nucléotidique ou la séquence peptidique la plus fréquente à chaque position d'un alignement de séquences. Elle représente le résultat d'alignements de séquences multiples dans lesquelles les séquences apparentées sont comparées les unes aux autres afin de déterminer les motifs les plus fréquents. Cette information est importante pour les protéines dépendantes des séquences nucléotidiques, telles que les ARN polymérases.
Réparation de l'ADNright|vignette|Chromosomes montrant de nombreuses lésions. La réparation de l'ADN est un ensemble de processus par lesquels une cellule identifie et corrige les dommages aux molécules d'ADN qui codent son génome. Dans les cellules, l'acide désoxyribonucléique (ADN) est soumis continuellement à des activités métaboliques normales et à des facteurs environnementaux portant atteinte à son intégrité. Ces facteurs environnementaux sont le plus souvent de nature chimique comme les radicaux libres de l'oxygène et les agents alkylants, ou physique, comme les radiations ultraviolettes et les rayonnements ionisants.
Protein Data BankLa banque de données sur les protéines ou BDP du Research Collaboratory for Structural Bioinformatics, plus communément appelée Protein Data Bank ou PDB est une collection mondiale de données sur la structure tridimensionnelle (ou structure 3D) de macromolécules biologiques : protéines, essentiellement, et acides nucléiques. Ces structures sont essentiellement déterminées par cristallographie aux rayons X ou par spectroscopie RMN. Ces données expérimentales sont déposées dans la PDB par des biologistes et des biochimistes du monde entier et appartiennent au domaine public.
Biologie structuralevignette|droite|Structure 3D de la myoglobine du grand cachalot (PDB ID 1MBO), la première protéine dont la structure a été résolue par cristallographie aux rayons X par John Kendrew et al. en 1958. La biologie structurale est la branche de la biologie qui étudie la structure et l'organisation spatiale des macromolécules biologiques, principalement les protéines et les acides nucléiques.
Famille de protéinesUne famille de protéines est un ensemble de protéines généralement codées par une famille de gènes. Les familles de protéines regroupent des protéines ayant des caractéristiques proches en termes de structure, de fonction enzymatique et de fonction cellulaire. Le terme famille de protéines peut être employé pour décrire un groupe de protéines non apparentées mais partageant une fonction commune, par exemple, les protéines de choc thermique, la désignation correcte serait ici de parler de classe de protéines.