Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours introduit PAX, une solution hybride pour un stockage efficace des données, en décomposant les pages slotted en mini-pages par attribut pour améliorer la convivialité du cache et réduire les délais d'E/S. Il examine comment PAX peut remplacer NSM en place, son adoption par les principaux systèmes de bases de données et ses avantages pour les requêtes analytiques. La séance de cours couvre également Parquet, un format de stockage colonnel pour Hadoop, qui permet un traitement efficace des données en ne stockant que les données pertinentes et en supportant les structures de données imbriquées.