Data PreprocessingData preprocessing can refer to manipulation or dropping of data before it is used in order to ensure or enhance performance, and is an important step in the data mining process. The phrase "garbage in, garbage out" is particularly applicable to data mining and machine learning projects. Data collection methods are often loosely controlled, resulting in out-of-range values, impossible data combinations, and missing values, amongst other issues. Analyzing data that has not been carefully screened for such problems can produce misleading results.
Centre de donnéesvignette|Centre de traitement de données. Un centre de données (en anglais data center ou data centre), ou centre informatique est un lieu (et un service) où sont regroupés les équipements constituants d'un système d'information (ordinateurs centraux, serveurs, baies de stockage, équipements réseaux et de télécommunications). Ce regroupement permet de faciliter la sécurisation, la gestion (notamment l'exécution de calculs et le refroidissement) et la maintenance des équipements et des données stockées.
Clipping (infographie)En programmation graphique 3D, la méthode du clipping consiste à ne pas calculer les objets extérieurs au cône de vision d'une scène, ou de ne pas calculer les objets ou parties d'objets cachées afin d'optimiser le temps de calcul. Par extension, dans le domaine du jeu vidéo, le clipping est un problème graphique consistant en l'affichage, la disparition ou la modification d'objets dans une scène, résultant de l'optimisation du temps de calcul. En effet on voit souvent ce phénomène apparaître lors de l'utilisation de level of detail.
Gestion des données de référenceLa gestion des données de référence ou gestion des données maîtres (GDR, plus connue sous le vocable anglais de master data management ou MDM) est une branche des technologies de l'information qui définit un ensemble de concepts et de processus visant à définir, stocker, maintenir, distribuer et imposer une vue complète, fiable et à jour des données référentielles au sein d’un système d’information, indépendamment des canaux de communications, du secteur d'activité ou des subdivisions métiers ou géographiqu
Élément de donnéeDans les métadonnées, un élément est une unité de donnée élémentaire qui a : une identification telle que nom d'élément (data element name) ; une définition claire ; un ou plusieurs termes de représentation ; des valeurs optionnelles énumérées (code (métadonnée)) ; une liste de synonymes des éléments dans d'autres registres de métadonnées (:en:Synonym ring). On peut découvrir l'usage des éléments de donnée en inspectant les logiciels applicatifs ou les fichiers de données de l'application par un processus manuel ou automatique de découverte et compréhension de l'application.
Geospatial topologyGeospatial topology is the study and application of qualitative spatial relationships between geographic features, or between representations of such features in geographic information, such as in geographic information systems (GIS). For example, the fact that two regions overlap or that one contains the other are examples of topological relationships. It is thus the application of the mathematics of topology to GIS, and is distinct from, but complementary to the many aspects of geographic information that are based on quantitative spatial measurements through coordinate geometry.
Berkeley Open Infrastructure for Network ComputingBOINC, acronyme de Berkeley Open Infrastructure for Network Computing (« infrastructure ouverte de Berkeley dédiée au calcul en réseau ») est une plate-forme de calcul distribué qui permet de gérer des projets de calcul sur la base du volontariat. Développée à l'origine pour le projet de recherche d'intelligence extraterrestre SETI@home par l'université de Californie à Berkeley, elle a été généralisée pour de nombreuses autres applications scientifiques.
In-memory processingIn computer science, in-memory processing (PIM) is a computer architecture for processing data stored in an in-memory database. In-memory processing improves the power usage and performance of moving data between the processor and the main memory. Older systems have been based on disk storage and relational databases using Structured Query Language, which are increasingly regarded as inadequate to meet business intelligence (BI) needs.
GéomatiqueLa géomatique regroupe l'ensemble des outils et méthodes permettant d'acquérir, de représenter, d'analyser et d'intégrer des données géographiques. La géomatique consiste donc en au moins trois activités distinctes : collecte, traitement et diffusion des données géographiques. Le mot « géomatique » est issu de la contraction des termes « géographie » et « informatique ». La géomatique est étroitement liée à l'information géographique, qui est la représentation d'un objet ou d'un phénomène localisé dans l'espace.
Dimension (data warehouse)A dimension is a structure that categorizes facts and measures in order to enable users to answer business questions. Commonly used dimensions are people, products, place and time. (Note: People and time sometimes are not modeled as dimensions.) In a data warehouse, dimensions provide structured labeling information to otherwise unordered numeric measures. The dimension is a data set composed of individual, non-overlapping data elements. The primary functions of dimensions are threefold: to provide filtering, grouping and labelling.