Séance de cours

Flux de données : algorithmes et applications

Description

Cette séance de cours introduit le concept de flux de données, en se concentrant sur le calcul de statistiques avec une mémoire sous-linéaire et en estimant efficacement les quantités. Il couvre des techniques telles que le comptage d'éléments distincts, la recherche de frappeurs lourds et l'approximation du nombre-distinct à l'aide d'algorithmes tels que Flajolet-Martin. La séance de cours explore également la similitude des documents, discutant des bardeaux, des croquis et des méthodes de comparaison des croquis. En outre, il explore les distances et les requêtes les plus proches des voisins dans des données de grande dimension, présentant des techniques de réduction de dimension randomisées telles que le lemme Johnson-Lindenstrauss et la projection aléatoire. L'instructeur fournit des exemples pratiques et des applications, soulignant l'importance de ces algorithmes dans la gestion des défis «Big Data».

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.