Cette séance de cours couvre l'importance de la localisation des données dans les décisions de planification, en se concentrant sur les plates-formes multi-locataires. Il traite des choix architecturaux d'Hadoop, des optimisations du moteur d'exécution et des optimisations du modèle de programmation. La séance de cours explore également au-delà des options MapReduce pour le traitement distribué sur Big Data, les exigences de tolérance aux pannes, les stratégies de sécurité des données et les techniques de récupération d'emploi.