Cette séance de cours explore les défis de l'informatique distribuée, en soulignant la nécessité du parallélisme pour gérer des tailles de données toujours croissantes. L'instructeur discute des modèles d'exécution pour les plates-formes dans l'analyse de données, de la croissance exponentielle des données, des types de sources de données et de la bataille contre les trois V (volume, vitesse, variété) dans le big data. La séance de cours explore également les complexités de la gestion des données structurées et non structurées, l'importance de l'harmonisation des données et les compromis entre l'intégration des données et le temps de requête.
Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.
Regarder sur Mediaspace