Résumé
Un tableau croisé dynamique (TCD) (en anglais pivot table) est un tableau de valeurs groupées qui regroupe les éléments individuels d'un tableau plus étendu (provenant par exemple d'une base de données, d'un tableur ou d'un système d'informatique décisionnelle) dans une ou plusieurs catégories distinctes. Ce résumé peut inclure des sommes, des moyennes ou d'autres statistiques, que le tableau croisé dynamique regroupe à l'aide d'une fonction d'agrégation choisie appliquée aux valeurs groupées. Le « TCD » est l'outil des « tris croisés », de l'analyse corrélative ou inférentielle, et sert à construire un tableau de contingence. Dans leur livre Pivot Table Data Crunching, Bill Jelen et Mike Alexander considèrent Pito Salas comme le « père des tableaux croisés dynamiques ». Alors qu'il travaillait sur un concept pour un nouveau programme qui allait devenir Lotus Improv, Salas a remarqué que les feuilles de calcul comportaient des structures de données. Un outil qui pourrait aider l'utilisateur à reconnaître ces structures permettrait de construire rapidement des modèles de données avancés. Avec Improv, les utilisateurs pouvaient définir et stocker des ensembles de catégories, puis changer de vue en faisant glisser les noms des catégories avec la souris. Cette fonctionnalité de base fournirait le modèle des tableaux croisés dynamiques. La base de départ est une plage de cellules où chaque ligne correspond à un enregistrement (cf. tableau du haut, où la plage « A1:E16 » regroupe 15 enregistrements et 1 ligne d'en-tête). La première ligne de la plage est constituée des titres des champs (en-tête des colonnes en gras). À l'aide de ces titres de champ, on crée le tableau croisé dynamique (tableau du bas). Dans une fenêtre spécifique, on déplace les étiquettes de champ soit sur une colonne soit sur une ligne. L'ordre des champs dans les lignes et les colonnes permet des regroupements de données variés. Les valeurs correspondantes sont généralement totalisées logiquement, ou transformées en moyennes ou en nombre de valeurs.
À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
Publications associées (1)
Concepts associés (7)
Tableau croisé dynamique
Un tableau croisé dynamique (TCD) (en anglais pivot table) est un tableau de valeurs groupées qui regroupe les éléments individuels d'un tableau plus étendu (provenant par exemple d'une base de données, d'un tableur ou d'un système d'informatique décisionnelle) dans une ou plusieurs catégories distinctes. Ce résumé peut inclure des sommes, des moyennes ou d'autres statistiques, que le tableau croisé dynamique regroupe à l'aide d'une fonction d'agrégation choisie appliquée aux valeurs groupées.
Fonction d'agrégation
In database management, an aggregate function or aggregation function is a function where the values of multiple rows are processed together to form a single summary value. Common aggregate functions include: Average (i.e., arithmetic mean) Count Maximum Median Minimum Mode Range Sum Others include: Nanmean (mean ignoring NaN values, also known as "nil" or "null") Stddev Formally, an aggregate function takes as input a set, a multiset (bag), or a list from some input domain I and outputs an element of an output domain O.
OLAP cube
An OLAP cube is a multi-dimensional array of data. Online analytical processing (OLAP) is a computer-based technique of analyzing data to look for insights. The term cube here refers to a multi-dimensional dataset, which is also sometimes called a hypercube if the number of dimensions is greater than three. A cube can be considered a multi-dimensional generalization of a two- or three-dimensional spreadsheet. For example, a company might wish to summarize financial data by product, by time-period, and by city to compare actual and budget expenses.
Afficher plus
Cours associés (2)
COM-490: Large-scale data science for real-world data
This hands-on course teaches the tools & methods used by data scientists, from researching solutions to scaling up prototypes to Spark clusters. It exposes the students to the entire data science pipe
CS-422: Database systems
This course is intended for students who want to understand modern large-scale data analysis systems and database systems. It covers a wide range of topics and technologies, and will prepare students