Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre les modèles d'exécution pour l'informatique distribuée, en mettant l'accent sur Hadoop et MapReduce. Il explique les concepts de copies primaires et de sauvegarde, de dégroupement intercalé et de gestion des défaillances dans les systèmes distribués. L'instructeur discute des défis de la tolérance aux défauts, de la localisation des données et de la programmation à Hadoop, ainsi que des choix architecturaux et des optimisations dans l'écosystème Hadoop. La séance de cours se penche également sur les limites de MapReduce, l'importance de la sécurité des données, les mécanismes de tolérance aux défauts, et d'autres cadres de traitement distribué comme Spark et Pregel.
Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.
Regarder sur Mediaspace