Cette séance de cours couvre les défis de la gestion de grands volumes de données, en discutant de la croissance des données numériques, les caractéristiques des grandes données (volume, vitesse, variété, variabilité, véracité), et la machine de base de données parallèle Gamma. Il explore également des techniques de dégroupage comme le haschich et le range, leurs compromis et des stratégies de gestion des échecs telles que le dégroupage entrelacé et enchaîné. La séance de cours explore en détail la façon dont les données sont réparties entre les nœuds, l'impact des défaillances sur la disponibilité des données et le processus de récupération des données en cas de défaillance des nœuds.