Motif structurelEn biochimie, un motif structurel, également écrit motif structural, est un arrangement tridimensionnel d'au moins deux structures secondaires de biopolymères, tels que des protéines ou des acides nucléiques, ayant une signification fonctionnelle ou faisant partie d'un domaine protéique. Les motifs structurels des protéines sont souvent conservés au cours de l'évolution et peuvent être le signe de similitudes fonctionnelles entre protéines partageant un même motif structurel ; il n'est cependant pas possible de déduire la fonction biologique d'une protéine sur la base de ses seuls motifs structurels, qui ne sont de surcroît pas toujours directement déductibles de leurs motifs séquentiels.
Structural alignmentStructural alignment attempts to establish homology between two or more polymer structures based on their shape and three-dimensional conformation. This process is usually applied to protein tertiary structures but can also be used for large RNA molecules. In contrast to simple structural superposition, where at least some equivalent residues of the two structures are known, structural alignment requires no a priori knowledge of equivalent positions.
Apprentissage superviséL'apprentissage supervisé (supervised learning en anglais) est une tâche d'apprentissage automatique consistant à apprendre une fonction de prédiction à partir d'exemples annotés, au contraire de l'apprentissage non supervisé. On distingue les problèmes de régression des problèmes de classement. Ainsi, on considère que les problèmes de prédiction d'une variable quantitative sont des problèmes de régression tandis que les problèmes de prédiction d'une variable qualitative sont des problèmes de classification.
Angle dièdreEn géométrie, l'angle entre deux plans est appelé angle dièdre, ou angle diédral (anglicisme). L'angle dièdre d'un tétraèdre régulier, correspond à l'angle observé au sol, dans un plan perpendiculaire à l'une des arêtes au sol, que font la base du tétraèdre et une face. Face dont la base est, au sol, « vue de bout » (soit un point pour une arête). L'angle dièdre de deux plans peut être mesuré sur les « bords » des plans, c'est-à-dire suivant leur ligne d'intersection.
Repliement des protéinesthumb|right|300px|Repliement des protéines Le repliement des protéines est le processus physique par lequel un polypeptide se replie dans sa structure tridimensionnelle caractéristique dans laquelle il est fonctionnel. Chaque protéine commence sous forme de polypeptide, transcodée depuis une séquence d'ARNm en une chaîne linéaire d'acides aminés. Ce polypeptide ne possède pas à ce moment de structure tridimensionnelle développée (voir côté gauche de la figure).
Diagramme de RamachandranLe diagramme de Ramachandran est une représentation graphique permettant d'analyser la conformation du squelette polypeptidique des protéines. Pour chaque acide aminé de la protéine, on porte la valeur de l'angle diédral φ en abscisse et celle de l'angle diédral ψ en ordonnée, pour des valeurs de -180 à +180 degrés. En raison de la périodicité aux limites du diagramme, la représentation de Ramachandran est formellement équivalente à un tore déplié.
Protein Data BankLa banque de données sur les protéines ou BDP du Research Collaboratory for Structural Bioinformatics, plus communément appelée Protein Data Bank ou PDB est une collection mondiale de données sur la structure tridimensionnelle (ou structure 3D) de macromolécules biologiques : protéines, essentiellement, et acides nucléiques. Ces structures sont essentiellement déterminées par cristallographie aux rayons X ou par spectroscopie RMN. Ces données expérimentales sont déposées dans la PDB par des biologistes et des biochimistes du monde entier et appartiennent au domaine public.
Protéines intrinsèquement désordonnéesLes protéines intrinsèquement désordonnées ou intrinsèquement non structurées sont des protéines qui manquent de structure tridimensionnelle stable, ce qui leur confère une forte plasticité qui est à l'origine de leur importance dans les phénomènes biologiques. Une protéine peut être totalement désordonnée, mais le cas le plus courant est celui où seulement une partie de la molécule, plus ou moins longue, est désordonnée (exemple : ).
Sequence motifIn biology, a sequence motif is a nucleotide or amino-acid sequence pattern that is widespread and usually assumed to be related to biological function of the macromolecule. For example, an N-glycosylation site motif can be defined as Asn, followed by anything but Pro, followed by either Ser or Thr, followed by anything but Pro residue. When a sequence motif appears in the exon of a gene, it may encode the "structural motif" of a protein; that is a stereotypical element of the overall structure of the protein.
Weak supervisionWeak supervision, also called semi-supervised learning, is a paradigm in machine learning, the relevance and notability of which increased with the advent of large language models due to large amount of data required to train them. It is characterized by using a combination of a small amount of human-labeled data (exclusively used in more expensive and time-consuming supervised learning paradigm), followed by a large amount of unlabeled data (used exclusively in unsupervised learning paradigm).