Big dataLe big data ( « grosses données » en anglais), les mégadonnées ou les données massives, désigne les ressources d’informations dont les caractéristiques en termes de volume, de vélocité et de variété imposent l’utilisation de technologies et de méthodes analytiques particulières pour créer de la valeur, et qui dépassent en général les capacités d'une seule et unique machine et nécessitent des traitements parallélisés. L’explosion quantitative (et souvent redondante) des données numériques permet une nouvelle approche pour analyser le monde.
Entrepôt de donnéesvignette|redresse=1.5|Vue d'ensemble d'une architecture entrepôt de données. Le terme entrepôt de données ou EDD (ou base de données décisionnelle ; en anglais, data warehouse ou DWH) désigne une base de données utilisée pour collecter, ordonner, journaliser et stocker des informations provenant de base de données opérationnelles et fournir ainsi un socle à l'aide à la décision en entreprise. Un entrepôt de données est une base de données regroupant une partie ou l'ensemble des données fonctionnelles d'une entreprise.
Ensemble négligeablevignette|Le triangle de Sierpiński est un exemple d'ensemble nul de points dans R 2 \mathbb {R} ^{2}. En théorie de la mesure, dans un espace mesuré, un ensemble négligeable est un ensemble de mesure nulle ou une partie d'un tel ensemble. La définition peut dépendre de la mesure choisie : deux mesures sur un même espace mesurable qui ont les mêmes ensembles de mesure nulle sont dites équivalentes. À un niveau élémentaire, il est possible d'aborder la notion d'ensemble négligeable pour un certain nombre d'espaces (dont la droite réelle) sans avoir à introduire une mesure.
Algèbre des parties d'un ensembleEn théorie des ensembles, l'ensemble des parties d'un ensemble, muni des opérations d'intersection, de réunion, et de passage au complémentaire, possède une structure d'algèbre de Boole. D'autres opérations s'en déduisent, comme la différence ensembliste et la différence symétrique. L'algèbre des parties d'un ensemble étudie l'arithmétique de ces opérations (voir l'article « Opération ensembliste » pour des opérations qui ne laissent pas stable l'ensemble des parties d'un ensemble).
Family of setsIn set theory and related branches of mathematics, a collection of subsets of a given set is called a family of subsets of , or a family of sets over More generally, a collection of any sets whatsoever is called a family of sets, set family, or a set system. A family of sets may be defined as a function from a set , known as the index set, to , in which case the sets of the family are indexed by members of .
Union (mathématiques)Dans la théorie des ensembles, l'union ou réunion est une opération ensembliste de base. En algèbre booléenne, l'union est associée à l'opérateur logique ou inclusif et est notée ∪. L'union de deux ensembles A et B est l'ensemble qui contient tous les éléments qui appartiennent à A ou appartiennent à B. On la note A ∪ B et on la dit « A union B » Formellement : Par exemple l'union des ensembles A = {1, 2, 3} et B = {2, 3, 4} est l'ensemble {1, 2, 3, 4}.
Gestion des donnéesLa gestion des données est une discipline de gestion qui tend à valoriser les données en tant que ressources numériques. La gestion des données permet d'envisager le développement d'architectures, de réglementations, de pratiques et de procédures qui gèrent correctement les besoins des organismes sur le plan de tout le cycle de vie des données. Les données sont, avec les traitements, l'un des deux aspects des systèmes d'information traditionnellement identifiés, et l'un ne peut aller sans l'autre pour un management du système d'information cohérent.
Science des donnéesLa science des données est l'étude de l’extraction automatisée de connaissance à partir de grands ensembles de données. Plus précisément, la science des données est un domaine interdisciplinaire qui utilise des méthodes, des processus, des algorithmes et des systèmes scientifiques pour extraire des connaissances et des idées à partir de nombreuses données structurées ou non . Elle est souvent associée aux données massives et à l'analyse des données.
Algèbre d'ensemblesLe concept intervient dans l'exposition des bases de la théorie de la mesure, sous des noms assez variés dans les sources en français : outre algèbre d'ensembles, et sa variante corps d'ensembles, on trouve aussi algèbre de Boole de parties, ou plus brièvement algèbre de Boole, voire simplement algèbre, et encore anneau booléen unitaire ou clan unitaire. Cette définition évoque celle d'une tribu ; en les rapprochant on constate immédiatement qu'un ensemble de parties d'un ensemble est une tribu si et seulement si c'est une algèbre d'ensembles stable par réunion dénombrable.
Données brutesLes données brutes (aussi connu comme données primaires) sont les données non interprétées émanant d'une source primaire, ayant des caractéristiques liées à celle-ci et qui n'ont été soumises à aucun traitement ou toute autre manipulation. Les données brutes peuvent être entrées dans un programme informatique ou utilisées dans des procédures manuelles telles que l'analyse statistique d'une enquête. Il peut s'agir des données binaires des périphériques de stockage électroniques comme les lecteurs de disque dur.