Séance de cours

Modèles d'exécution informatiques distribués

Dans cours

This course is intended for students who want to understand modern large-scale data analysis systems and database systems. It covers a wide range of topics and technologies, and will prepare students

Description

Cette séance de cours traite des défis à relever pour réduire au minimum le temps d'achèvement du travail dans l'informatique distribuée, en mettant l'accent sur les questions liées aux erreurs de données et leur incidence sur le rendement. Il explore les implications de la distribution de données biaisée sur les réducteurs, les limites des approches standard et les objectifs d'optimisation pour améliorer l'efficacité. La présentation couvre des modèles d'exécution comme MapReduce et Spark, soulignant l'importance du parallélisme et d'un traitement efficace. Différents algorithmes pour theta-joins sont examinés, y compris l'algorithme 1-Bucket-Theta, mettant en évidence les avantages de la randomisation en réduisant le biais de sortie. La séance de cours conclut en abordant les défis qui restent à relever pour parvenir à un calcul de joint optimal sur les données distribuées.

Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.

Regarder sur Mediaspace

Enseignant

Anastasia Ailamaki

Source officielle

Séances de cours associées (31)

Algorithmes d'optimisation

Couvre les algorithmes d'optimisation, en se concentrant sur Proximal Gradient Descent et ses variations.

Bandits à bras multiples

Discute des algorithmes pour équilibrer l'exploration et l'exploitation dans les processus décisionnels.

Réduction des écarts : stratégies et applications

Discute des techniques de réduction de la variance dans la simulation stochastique, en se concentrant sur les stratégies d'allocation et les algorithmes de génération de répliques.

Optimisation quasi-newton

Couvre les méthodes de recherche de ligne de gradient et les techniques d'optimisation en mettant l'accent sur les conditions Wolfe et la définition positive.

Introduction aux algorithmes

Explore les ingrédients et la sélection d'algorithmes pour différents objectifs.

Afficher plus