Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre l'écosystème Hadoop, en se concentrant sur les choix architecturaux d'Hadoop, y compris la couche de stockage, le modèle de programmation, le moteur d'exécution, la planification, les optimisations et la tolérance aux pannes. Il se penche également sur le modèle de programmation MapReduce, expliquant le modèle de données, les fonctions de base et fournissant un exemple de code pour le problème de comptage de mots. La séance de cours traite des abstractions HDFS, de la réplication, des échecs, de l'évaluation et du fonctionnement sous-jacent de MapReduce, en soulignant ses forces et ses limites.