Data PreprocessingData preprocessing can refer to manipulation or dropping of data before it is used in order to ensure or enhance performance, and is an important step in the data mining process. The phrase "garbage in, garbage out" is particularly applicable to data mining and machine learning projects. Data collection methods are often loosely controlled, resulting in out-of-range values, impossible data combinations, and missing values, amongst other issues. Analyzing data that has not been carefully screened for such problems can produce misleading results.
Traitement de donnéesEn informatique, le terme traitement de données ou traitement électronique des données renvoie à une série de processus qui permettent d'extraire de l'information ou de produire du savoir à partir de données brutes. Ces processus, une fois programmés, sont le plus souvent automatisés à l'aide d'ordinateurs. Si les résultats finaux produits par ces processus sont destinés à des humains, leur présentation est souvent essentielle pour en apprécier la valeur. Cette appréciation est cependant variable selon les personnes.
GenèveGenève est une ville suisse située à l'extrémité sud-ouest du Léman. Elle est la deuxième ville la plus peuplée de Suisse après Zurich, et le chef-lieu de la République et canton de Genève (GE). Au , la ville comptait dans , mais à la même date, son aire métropolitaine transfrontalière, définie par Eurostat et l'OFS suivant la méthodologie des zones urbaines fonctionnelles, c'est-à-dire l'agglomération et la couronne périurbaine, comptait dans à cheval sur la Suisse et la France.
DonnéeUne donnée est ce qui est connu et qui sert de point de départ à un raisonnement ayant pour objet la détermination d'une solution à un problème en relation avec cette donnée. Cela peut être une description élémentaire qui vise à objectiver une réalité, le résultat d'une comparaison entre deux événements du même ordre (mesure) soit en d'autres termes une observation ou une mesure. La donnée brute est dépourvue de tout raisonnement, supposition, constatation, probabilité.
Exploration de donnéesL’exploration de données, connue aussi sous l'expression de fouille de données, forage de données, prospection de données, data mining, ou encore extraction de connaissances à partir de données, a pour objet l’extraction d'un savoir ou d'une connaissance à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques.
Canton de GenèveLe canton de Genève (GE), officiellement la République et canton de Genève, est l'un des de la Suisse. Son chef-lieu est Genève. Au , la population du canton s’établit à . Il s’agit du successeur de la république de Genève, indépendante depuis le jusqu'à son intégration dans la République française en 1798. Elle retrouve son indépendance le après le départ des armées de , puis devient un canton suisse le . La république et canton de Genève occupe une superficie modeste, inférieure à celle du district de Nyon, mais elle est densément peuplée, car elle abrite la seconde ville de Suisse.
Modélisation des donnéesDans la conception d'un système d'information, la modélisation des données est l'analyse et la conception de l'information contenue dans le système afin de représenter la structure de ces informations et de structurer le stockage et les traitements informatiques. Il s'agit essentiellement d'identifier les entités logiques et les dépendances logiques entre ces entités.
Data dredgingvignette|Exemple de Data dredging. Le data dredging (littéralement le dragage de données mais mieux traduit comme étant du triturage de données) est une technique statistique qui . Une des formes du data dredging est de partir de données ayant un grand nombre de variables et un grand nombre de résultats, et de choisir les associations qui sont « statistiquement significatives », au sens de la valeur p (on parle aussi de p-hacking).
Consolidation informatiqueLa consolidation est en informatique le regroupement cohérent de données. Elle concerne généralement des données organisées logiquement ou liées entre elles. Plus spécifiquement pour les tableurs, il s’agit du regroupement de plusieurs tableaux issus de feuilles différentes (les feuilles sont des composantes des tableurs) voire de classeurs différents. La consolidation de données consiste à rassembler plusieurs données semblables afin d’obtenir un rapport plus facile à consulter que l’information brute présente sur le serveur, avec le moins de perte d’information possible.
Conventions de Genèvevignette|Fac-similé de l'original de la première convention de Genève (1864). Les conventions de Genève sont des traités internationaux fondamentaux dans le domaine du droit international humanitaire. Elles dictent les règles de conduite à adopter en période de conflits armés, et notamment la protection des civils, des membres de l'aide humanitaire, des blessés ou encore, des prisonniers de guerre. La première convention de Genève date de 1864. Cependant, les textes qui sont en vigueur aujourd’hui ont été écrits après la Seconde Guerre mondiale.