Partition (base de données)

Dans une base de données, une partition est une division logique d'une table stockée en plusieurs parties indépendantes. Il peut être horizontal (les lignes d'une même table sont divisées en plusieurs partitions) ou vertical (les colonnes d'une même table sont divisées en plusieurs lots). Le partitionnement de tables est généralement effectué pour améliorer la gestion, la performance ou la disponibilité. Chaque partition peut être placée sur des serveurs ou des disques différents. Cela permet également d'obtenir une capacité de base de données supérieure à la taille maximum des disques durs ou d'effectuer des requêtes en parallèle sur plusieurs partitions. Les principes de partitionnement de tables dans les SGBD reposent sur la famille d'algorithmes "diviser pour régner". Base de données orientée ligne Le partitionnement horizontal d'une table divise les données en blocs de lignes, généralement en fonction de la clef primaire. Base de données orientée colonne Le partitionnement vertical d'une table divise les données en blocs de colonnes. On décide généralement de partitionner une table de manière verticale lorsque celle-ci possède un degré trop élevé (le nombre de colonnes est appelé degré). On parle alors de table "obèse". Les critères retenus pour un partitionnement vertical sont généralement liés à l'usage de la table. On constate que certaines colonnes de la table sont lues de manière conjointe, tandis que d'autres sont ignorées. On isole alors les différentes colonnes lues conjointement pour former, en quelque sorte, des "sous-tables" liées par la clef primaire conjointe. Ce partitionnement permet de réduire la consommation des E/S (Entrées/Sorties) c'est-à-dire des pages lues ou écrites (moins d'utilisation du cache), comme de minimiser la quantité de données verrouillées lors des écritures (moins de blocages), il en résulte donc des gains de performance. centré|vignette|1412x1412px|Table obèse pouvant être partitionnée La table obèse montrée ci-avant, peut être découpée en plusieurs partitions verticales, chacune répondant à des besoins d'exploitation différents.

Dalton: Learned Partitioning for Distributed Data Streams

Anastasia Ailamaki, Eleni Zapridou, Ioannis Mytilinis

To sustain the input rate of high-throughput streams, modern stream processing systems rely on parallel execution. However, skewed data yield imbalanced load assignments and create stragglers that hinder scalability. Deciding on a static partitioning for a ...

2022

A system design for elastically scaling transaction processing engines in virtualized servers

Anastasia Ailamaki, Raja Appuswamy, Angelos Christos Anadiotis, Hillel Avni

Online Transaction Processing (OLTP) deployments are migrating from on-premise to cloud settings in order to exploit the elasticity of cloud infrastructure which allows them to adapt to workload variations. However, cloud adaptation comes at the cost of re ...

ASSOC COMPUTING MACHINERY2020

Dalton: Learned Partitioning for Distributed Data Streams

Anastasia Ailamaki, Eleni Zapridou, Ioannis Mytilinis

2022

A system design for elastically scaling transaction processing engines in virtualized servers

Anastasia Ailamaki, Raja Appuswamy, Angelos Christos Anadiotis, Hillel Avni

ASSOC COMPUTING MACHINERY2020

Dalton: Learned Partitioning for Distributed Data Streams

A system design for elastically scaling transaction processing engines in virtualized servers

Monitoring distributed fragmented skylines

Graph Chatbot

Dalton: Learned Partitioning for Distributed Data Streams

A system design for elastically scaling transaction processing engines in virtualized servers

Monitoring distributed fragmented skylines