Séance de cours

Système d'exécution distribué à usage général

Description

Cette séance de cours traite de la conception d'un système d'exécution distribué à usage général, en mettant l'accent sur les applications d'échelle, l'exécution distribuée devenant la norme. Il couvre les défis de la construction de systèmes distribués, de l'utilisation de cadres spécialisés comme Spark et Flink, et de la mise en œuvre de contrats à terme distribués pour des shuffles hautement performants et tolérants aux défauts. La séance de cours explore les avantages d'une logique de contrôle décentralisée, de stratégies de renvoi par correspondance et de l'utilisation d'avenir pour les CPR asynchrones. Il présente également les résultats de l'utilisation d'Exoshuffle pour améliorer la vitesse et la précision de l'entraînement en ML, ainsi que les progrès dans les modèles de tolérance aux défauts et de propriété pour les contrats à terme distribués.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.