Séance de cours

Résolution des entités dans les flux de données

Description

Cette séance de cours porte sur les défis de la résolution d'entités dans les flux de données, en mettant l'accent sur le coût élevé et l'inefficacité des approches existantes. L'instructeur présente des optimisations comme Locality Sensitive Hashing et Prefix Filtering pour améliorer le débit de résolution. Des techniques telles que le blocage et l'équilibre de la charge de travail sont discutées pour gérer les distributions déséquilibrées. La séance de cours se penche également sur la configuration expérimentale à l'aide de Flink, de données synthétiques et de fenêtres coulissantes en streaming. Des stratégies d'optimisation multi-objectifs sont explorées pour améliorer les performances, ainsi que le cloisonnement en temps réel de la charge de travail. La conclusion met l'accent sur l'optimisation de la résolution de l'entité de façon en continu et propose des travaux futurs pour réduire davantage les comparaisons et améliorer l'efficacité.

Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.

Regarder sur Mediaspace
À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.