Famille de protéinesUne famille de protéines est un ensemble de protéines généralement codées par une famille de gènes. Les familles de protéines regroupent des protéines ayant des caractéristiques proches en termes de structure, de fonction enzymatique et de fonction cellulaire. Le terme famille de protéines peut être employé pour décrire un groupe de protéines non apparentées mais partageant une fonction commune, par exemple, les protéines de choc thermique, la désignation correcte serait ici de parler de classe de protéines.
Domaine protéiqueredresse=1.15|vignette|Exemples de structures de protéines organisées en domaines distincts. Le domaine de couleur brique, appelé domaine PH, est commun aux deux protéines,. Sa fonction est de fixer le phosphatidylinositol-3,4,5-trisphosphate (PIP3) Un domaine protéique est une partie d'une protéine capable d'adopter une structure de manière autonome ou partiellement autonome du reste de la molécule. C'est un élément modulaire de la structure des protéines qui peuvent ainsi être composées de l'assemblage de plusieurs de ces domaines.
InterProInterPro est une base de données intégrées de « signatures » de domaines et de signaux protéiques utilisée pour la classification et l'annotation automatique de protéines. Interpro permet la classification des protéines en fonction de la présence de domaines fonctionnels, répétitions, et signaux grâce à une recherche automatisée dans plusieurs bases de données (CATH-Gene3D, HAMAP, PANTHER, Pfam, PIRSF, PRINTS, ProDom, PROSITE, SMART, SUPERFAMILY, TIGRFAMs). Catégorie:Base de données Protéines Catégorie:Rech
Super-famille de protéinesUne superfamille (ou super-famille) de protéines est le regroupement le plus large (clade) de protéines pour lesquelles il est possible d'identifier un ancêtre commun par homologie. Cet ancêtre commun est généralement déduit par et similitude mécanique, même lorsque aucune similitude entre les séquences n'est détectable. Les super-familles contiennent généralement plusieurs familles de protéines présentant des similitudes de séquences au sein de ces familles.
Markov modelIn probability theory, a Markov model is a stochastic model used to model pseudo-randomly changing systems. It is assumed that future states depend only on the current state, not on the events that occurred before it (that is, it assumes the Markov property). Generally, this assumption enables reasoning and computation with the model that would otherwise be intractable. For this reason, in the fields of predictive modelling and probabilistic forecasting, it is desirable for a given model to exhibit the Markov property.
Pfamvignette|Logo de la Pfam. Pfam est une base de données bio-informatique de familles de protéines qui classe diverses propriétés des domaines protéiques sur la base de leurs . Créée en 1997 par les bio-informaticiens Erik Sonnhammer de l'institut Karolinska à Stockholm, Sean Eddy de l'université Washington à Saint-Louis (Missouri) et Richard Durbin du centre Sanger à Cambridge, elle fournit notamment des informations sur l'architecture des domaines protéiques, leur distribution parmi les espèces vivantes, les liens vers d'autres bases de données et les structures connues de protéines de ces familles.
UniProtUniProt est une base de données de séquences de protéines. Son nom dérive de la contraction de Universal Protein Resource (base de données universelle de protéines). C'est une base de données ouverte, stable et accessible en ligne, elle est issue de la consolidation de l'ensemble des données produites par la communauté scientifique. UniProt est une base annotée, hiérarchisée où chaque séquence est accompagnée d'un ensemble riche de métadonnées et de liens vers de nombreuses autres bases de données : bibliographiques, phylogénétiques, nucléotidiques.
Modèle de Markov cachéUn modèle de Markov caché (MMC, terme et définition normalisés par l’ISO/CÉI [ISO/IEC 2382-29:1999]) — (HMM)—, ou plus correctement (mais non employé) automate de Markov à états cachés, est un modèle statistique dans lequel le système modélisé est supposé être un processus markovien de paramètres inconnus. Contrairement à une chaîne de Markov classique, où les transitions prises sont inconnues de l'utilisateur mais où les états d'une exécution sont connus, dans un modèle de Markov caché, les états d'une exécution sont inconnus de l'utilisateur (seuls certains paramètres, comme la température, etc.
Interaction protéine-protéinethumb|upright=1.2|L'inhibiteur de la ribonucléase en forme de fer à cheval (en représentation « fil de fer ») forme une interaction protéine–protéine avec la protéine de la ribonucléase. Les contacts entre les deux protéines sont représentés sous forme de taches colorées. Une Interaction protéine–protéine apparait lorsque deux ou plusieurs protéines se lient entre elles, le plus souvent pour mener à bien leur fonction biologique.
Chaîne de Markovvignette|Exemple élémentaire de chaîne de Markov, à deux états A et E. Les flèches indiquent les probabilités de transition d'un état à un autre. En mathématiques, une chaîne de Markov est un processus de Markov à temps discret, ou à temps continu et à espace d'états discret. Un processus de Markov est un processus stochastique possédant la propriété de Markov : l'information utile pour la prédiction du futur est entièrement contenue dans l'état présent du processus et n'est pas dépendante des états antérieurs (le système n'a pas de « mémoire »).