Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre le concept de traitement approximatif des requêtes à l'aide de BlinkDB, un cadre qui crée des échantillons de données pour fournir des réponses rapides et approximatives avec des barres d'erreur. Il explique comment BlinkDB prend en charge les requêtes d'agrégat, les filtres, les jointures et les fonctions définies par l'utilisateur. La séance de cours se penche également sur le compromis entre la vitesse et la précision des réponses aux questions, montrant l'efficacité des techniques d'échantillonnage. De plus, il examine l'importance d'apprendre à échantillonner efficacement les données, y compris les stratégies de création d'échantillons uniformes et stratifiés basés sur des ensembles de colonnes de requêtes prévisibles. Les méthodes d'estimation des erreurs et les aspects architecturaux de Spark Streaming sont également explorés.
Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.
Regarder sur Mediaspace