Point de défaillance unique

Un point de défaillance unique (single point of failure ou SPOF en anglais) est un point d'un système informatique dont le reste du système est dépendant et dont une panne entraîne l'arrêt complet du système. Le point de défaillance unique a comme principale caractéristique de ne pas être protégé (redondant). Il est donc un risque pour la disponibilité du système. Dans la définition , le mot anglais single souligne le caractère unique et donc fragile du « composant ». La notion de point de défaillance unique est fortement liée à celle de service, dans la mesure où un problème sur le point concerné entraîne une interruption de service. La présence d'un point de défaillance unique dans un système augmentant la probabilité d'apparition d'un déni de service, elle entraîne un risque sur la qualité de service. Dans un cadre de haute disponibilité, il est impossible de laisser des points individuels de défaillance dans un système. Potentiellement, tous les éléments d'une architecture physique peuvent devenir des points individuels de défaillance. Les éléments principaux sont : le proxy ; le pare-feu (firewall) ; le routeur ; l'opérateur réseau ; le serveur de répartition de charge ; le serveur de service (HTTP, LDAP, Base de données, stockage, etc.) ; tout câble ou interface réseau ; l'alimentation électrique. Selon les conditions où se situe l'hébergement de services à distance, on peut également l'appliquer au centre de données où est hébergé l'architecture : catastrophe naturelle (risque sismique, d’inondation, de fontis (effondrement de sols (à Paris par exemple, en raison des nombreuses carrières))) ; catastrophe industrielle (catastrophe nucléaire et zone d'exclusion nucléaire associée, explosion d'une usine pétrochimique) ; risque de bombardement, lors d'une guerre ; risque d'incendie (les centres sont généralement équipés de protection contre les incendies). Il en va de même pour nombre d'éléments de l'architecture logicielle, dans le cadre d'une Architecture Orientée Service (SOA).

Graph Chatbot

A Minimally Intrusive Low-Memory Approach to Resilience for Existing Transient Solvers

System Support for Efficient Replication in Distributed Systems

Monitoring distributed fragmented skylines

A Minimally Intrusive Low-Memory Approach to Resilience for Existing Transient Solvers

System Support for Efficient Replication in Distributed Systems

Monitoring distributed fragmented skylines