Domaine protéiqueredresse=1.15|vignette|Exemples de structures de protéines organisées en domaines distincts. Le domaine de couleur brique, appelé domaine PH, est commun aux deux protéines,. Sa fonction est de fixer le phosphatidylinositol-3,4,5-trisphosphate (PIP3) Un domaine protéique est une partie d'une protéine capable d'adopter une structure de manière autonome ou partiellement autonome du reste de la molécule. C'est un élément modulaire de la structure des protéines qui peuvent ainsi être composées de l'assemblage de plusieurs de ces domaines.
GlobineLes globines sont des protéines globulaires dont on pense qu'elles partagent un ancêtre commun, c'est-à-dire qu'elles forment une famille de protéines. Elles présentent toutes le repliement globine, qui fait intervenir huit hélices α. Ce sont des hémoprotéines intervenant dans le stockage ou le transport de l'oxygène : la myoglobine et l'hémoglobine sont deux membres éminents de cette famille, présente chez de très nombreux êtres vivants.
Matrice de similaritéLes matrices de similarité ou matrices de substitution sont des matrices utilisées en bioinformatique pour réaliser des alignements de séquences biologiques reliées évolutivement. Elles permettent de donner un score de similarité ou de ressemblance entre deux acides aminés. Ces matrices, M, sont des matrices 20 x 20 (pour les 20 acides aminés protéinogènes standards) qui recensent l'ensemble des scores M(a,b) obtenus lorsqu'on substitue l'acide aminé a à l'acide b dans un alignement.
Super-famille de protéinesUne superfamille (ou super-famille) de protéines est le regroupement le plus large (clade) de protéines pour lesquelles il est possible d'identifier un ancêtre commun par homologie. Cet ancêtre commun est généralement déduit par et similitude mécanique, même lorsque aucune similitude entre les séquences n'est détectable. Les super-familles contiennent généralement plusieurs familles de protéines présentant des similitudes de séquences au sein de ces familles.
Séquence conservéeEn biologie de l'évolution, les séquences conservées sont des séquences d'acides nucléiques (ADN et ARN) ou d'acide aminés identiques ou similaires au sein d'un génome (on parle alors de séquences paralogues) ; à travers les espèces (on parle alors de séquences orthologues), ou bien encore entre un taxon donneur et un taxon récepteur (on parle alors de séquences xénologues). La conservation indique qu'une séquence a été maintenue par la sélection naturelle.
Structure des protéinesLa structure des protéines est la composition en acides aminés et la conformation en trois dimensions des protéines. Elle décrit la position relative des différents atomes qui composent une protéine donnée. Les protéines sont des macromolécules de la cellule, dont elles constituent la « boîte à outils », lui permettant de digérer sa nourriture, produire son énergie, de fabriquer ses constituants, de se déplacer, etc. Elles se composent d'un enchaînement linéaire d'acides aminés liés par des liaisons peptidiques.
Séquence homologueEn biologie moléculaire, les séquences homologues sont deux ou plusieurs séquences nucléotidiques partageant une origine évolutive commune, c'est-à-dire présentant une homologie au sens de l'évolution moléculaire. Deux segments d'ADN distincts sont susceptibles d'avoir une origine commune à la suite d'une spéciation (orthologie), d'une duplication (paralogie) ou d'un transfert horizontal de gènes.
UniProtUniProt est une base de données de séquences de protéines. Son nom dérive de la contraction de Universal Protein Resource (base de données universelle de protéines). C'est une base de données ouverte, stable et accessible en ligne, elle est issue de la consolidation de l'ensemble des données produites par la communauté scientifique. UniProt est une base annotée, hiérarchisée où chaque séquence est accompagnée d'un ensemble riche de métadonnées et de liens vers de nombreuses autres bases de données : bibliographiques, phylogénétiques, nucléotidiques.
Structure primairevignette|Structure des protéines, en particulier la structure primaire En biochimie, la structure primaire d'une biomolécule non-ramifiée comme une protéine ou un brin d'ADN ou d'ARN, est la séquence de nucléotides ou d'acides aminés du début à la fin de la molécule. Autrement dit, la structure primaire représente l'exacte composition chimique et la séquence de ses sous-unités monomériques. La structure primaire d'un polymère biologique détermine largement sa forme tridimensionnelle, connue sous le nom de structure tertiaire.
Triade catalytiqueredresse=1.5|vignette| Site actif de la protéase TEV (), une peptidase très sélective du virus de la gravure du tabac, montrant le substrat en noir et les résidus de la triade catalytique en rouge, ici l'aspartate (acide), l'histidine (base) et la cystéine (nucléophile). En biologie moléculaire, on désigne généralement par triade catalytique les trois résidus d'acides aminés qui interviennent ensemble dans le site actif de certaines hydrolases et transférases telles que des peptidases, des amidases, des estérases, des lipases et des β-lactamases.