Cette séance de cours présente BlinkDB, un cadre pour le traitement approximatif des requêtes, qui prend en charge les requêtes agrégées interactives de type SQL sur des ensembles de données massifs en fournissant des réponses rapides et approximatives par échantillonnage. L'instructeur explique la stratégie de BlinkDB, le flux de travail, le compromis vitesse / précision et le concept d'apprentissage de l'échantillonnage. Différents types d'échantillons, tels que des échantillons uniformes et stratifiés, sont discutés, ainsi que des techniques d'estimation d'erreurs utilisant des fonctions agrégées de forme fermée et des bootstrap statistiques.