Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours présente BlinkDB, un cadre pour le traitement approximatif des requêtes, qui prend en charge les requêtes agrégées interactives de type SQL sur des ensembles de données massifs en fournissant des réponses rapides et approximatives par échantillonnage. L'instructeur explique la stratégie de BlinkDB, le flux de travail, le compromis vitesse / précision et le concept d'apprentissage de l'échantillonnage. Différents types d'échantillons, tels que des échantillons uniformes et stratifiés, sont discutés, ainsi que des techniques d'estimation d'erreurs utilisant des fonctions agrégées de forme fermée et des bootstrap statistiques.