Regroupement hiérarchiqueDans le domaine de l'analyse et de la classification automatique de données, le regroupement hiérarchique est un partitionnement de données ou clustering, au moyen de diverses méthodes, dites « ascendantes » et « descendantes ». Les méthodes dites « descendantes » partent d’une solution générale vers une autre plus spécifique. Les méthodes de cette catégorie démarrent avec une seule classe contenant la totalité puis se divisent à chaque étape selon un critère jusqu’à l’obtention d’un ensemble de classes différentes.
Protéine GLes sont une famille de protéines qui permettent le transfert d'informations à l'intérieur de la cellule. Elles participent ainsi à un mécanisme appelé transduction du signal. Cette protéine est appelée ainsi car elle utilise l'échange de GTP en GDP comme un « interrupteur moléculaire » pour déclencher ou inhiber des réactions biochimiques dans la cellule. La protéine G se lie au GTP et au GDP. Alfred G. Gilman et Martin Rodbell ont obtenu le prix Nobel de physiologie ou médecine en 1994 pour sa découverte et leurs travaux sur les protéines G.
Récepteur couplé aux protéines GLes récepteurs couplés aux protéines G (RCPG) sont une famille de récepteurs transmembranaires chez les mammifères. Parmi les nombreux récepteurs qui jouent un rôle dans la communication cellulaire, les récepteurs couplés aux protéines G (RCPG) constituent la plus grande famille de récepteurs membranaires de mammifères puisqu’elle représente 3,4 % du génome. Plus de la moitié des agents pharmacologiques agissent sur les RCPG : ils sont donc une classe de protéines d'importance thérapeutique majeure.
Super-famille de protéinesUne superfamille (ou super-famille) de protéines est le regroupement le plus large (clade) de protéines pour lesquelles il est possible d'identifier un ancêtre commun par homologie. Cet ancêtre commun est généralement déduit par et similitude mécanique, même lorsque aucune similitude entre les séquences n'est détectable. Les super-familles contiennent généralement plusieurs familles de protéines présentant des similitudes de séquences au sein de ces familles.
Partitionnement de donnéesvignette|upright=1.2|Exemple de clustering hiérarchique. Le partitionnement de données (ou data clustering en anglais) est une méthode en analyse des données. Elle vise à diviser un ensemble de données en différents « paquets » homogènes, en ce sens que les données de chaque sous-ensemble partagent des caractéristiques communes, qui correspondent le plus souvent à des critères de proximité (similarité informatique) que l'on définit en introduisant des mesures et classes de distance entre objets.
GTPasevignette|droite|300 px|Structure de la GTPase placentaire CDC42 liée au GDP. Les GTPases sont une classe importante d'enzymes qui catalysent l'hydrolyse de la guanosine triphosphate (GTP) pour donner une guanosine diphosphate (GDP) et un ion phosphate. La fixation du GTP est effectuée par un domaine très conservé dans l'évolution, appelé domaine G, caractéristique de l'ensemble de cette superfamille. Cette hydrolyse est en général couplée à un autre processus biologique, comme la transduction du signal dans la cellule.
K-moyennesLe partitionnement en k-moyennes (ou k-means en anglais) est une méthode de partitionnement de données et un problème d'optimisation combinatoire. Étant donnés des points et un entier k, le problème est de diviser les points en k groupes, souvent appelés clusters, de façon à minimiser une certaine fonction. On considère la distance d'un point à la moyenne des points de son cluster ; la fonction à minimiser est la somme des carrés de ces distances.
Single-linkage clusteringIn statistics, single-linkage clustering is one of several methods of hierarchical clustering. It is based on grouping clusters in bottom-up fashion (agglomerative clustering), at each step combining two clusters that contain the closest pair of elements not yet belonging to the same cluster as each other. This method tends to produce long thin clusters in which nearby elements of the same cluster have small distances, but elements at opposite ends of a cluster may be much farther from each other than two elements of other clusters.
Récepteur (biochimie)En biochimie, un récepteur est une protéine de la membrane cellulaire ou du cytoplasme ou du noyau cellulaire qui se lie spécifiquement à un facteur spécifique (un ligand, tels un neurotransmetteur, une hormone, une molécule médicamenteuse, une toxine, un ion calcium, ou une protéine spécifique de la membrane d'un virus...), induisant une réponse cellulaire à ce ligand. Les modifications du comportement du récepteur protéique induites par le ligand conduisent à des modifications physiologiques qui constituent les « effets biologiques » du ligand.
Famille de protéinesUne famille de protéines est un ensemble de protéines généralement codées par une famille de gènes. Les familles de protéines regroupent des protéines ayant des caractéristiques proches en termes de structure, de fonction enzymatique et de fonction cellulaire. Le terme famille de protéines peut être employé pour décrire un groupe de protéines non apparentées mais partageant une fonction commune, par exemple, les protéines de choc thermique, la désignation correcte serait ici de parler de classe de protéines.