Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours porte sur les défis de la résolution d'entités dans les flux de données, en mettant l'accent sur le coût élevé et l'inefficacité des approches existantes. L'instructeur présente des optimisations comme Locality Sensitive Hashing et Prefix Filtering pour améliorer le débit de résolution. Des techniques telles que le blocage et l'équilibre de la charge de travail sont discutées pour gérer les distributions déséquilibrées. La séance de cours se penche également sur la configuration expérimentale à l'aide de Flink, de données synthétiques et de fenêtres coulissantes en streaming. Des stratégies d'optimisation multi-objectifs sont explorées pour améliorer les performances, ainsi que le cloisonnement en temps réel de la charge de travail. La conclusion met l'accent sur l'optimisation de la résolution de l'entité de façon en continu et propose des travaux futurs pour réduire davantage les comparaisons et améliorer l'efficacité.
Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.
Regarder sur Mediaspace