Exploration de donnéesL’exploration de données, connue aussi sous l'expression de fouille de données, forage de données, prospection de données, data mining, ou encore extraction de connaissances à partir de données, a pour objet l’extraction d'un savoir ou d'une connaissance à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques.
Discrimination à l'embauchethumb|Affiche du MRAP contre les discriminations à l'embauche, dessin de Charb, 2000. Une discrimination à l'embauche est une discrimination évoquée lorsque des chercheurs d'emploi sont traités de manière différenciée sur une base de critères sélectifs qui manquent de justification objective et raisonnable à l'égard du poste de travail à pourvoir (tels que le sexe, l'origine ethnique, l'âge, la religion...), selon le législateur.
Décroissance démographiqueUne décroissance démographique ou un déclin démographique est, pour une zone ou un pays donné, une situation dans laquelle le nombre d’habitants diminue, que ce soit parce que le taux de mortalité est supérieur au taux de natalité, ou parce que les flux d’émigration nets sont supérieurs à l’accroissement naturel. Ces flux migratoires peuvent être induits par des guerres, des événements socio-politiques, des crises économiques ou des événements environnementaux (séismes, éruptions volcaniques, inondations).
Science des donnéesLa science des données est l'étude de l’extraction automatisée de connaissance à partir de grands ensembles de données. Plus précisément, la science des données est un domaine interdisciplinaire qui utilise des méthodes, des processus, des algorithmes et des systèmes scientifiques pour extraire des connaissances et des idées à partir de nombreuses données structurées ou non . Elle est souvent associée aux données massives et à l'analyse des données.
Labeled dataLabeled data is a group of samples that have been tagged with one or more labels. Labeling typically takes a set of unlabeled data and augments each piece of it with informative tags. For example, a data label might indicate whether a photo contains a horse or a cow, which words were uttered in an audio recording, what type of action is being performed in a video, what the topic of a news article is, what the overall sentiment of a tweet is, or whether a dot in an X-ray is a tumor.
Data PreprocessingData preprocessing can refer to manipulation or dropping of data before it is used in order to ensure or enhance performance, and is an important step in the data mining process. The phrase "garbage in, garbage out" is particularly applicable to data mining and machine learning projects. Data collection methods are often loosely controlled, resulting in out-of-range values, impossible data combinations, and missing values, amongst other issues. Analyzing data that has not been carefully screened for such problems can produce misleading results.