Recherche scientifiquevignette|Une laborantine du Laboratoire fédéral d'essai des matériaux et de recherche (EMPA) à Saint-Gall, en 1964. La recherche scientifique est, en premier lieu, l’ensemble des actions entreprises en vue de produire et de développer les connaissances scientifiques. Par extension métonymique, on utilise également ce terme dans le cadre social, économique, institutionnel et juridique de ces actions. thumb|Allégorie de la Recherche, bronze par , 1896, Thomas Jefferson Building.
Open researchOpen research is research that is openly accessible by others. Those who publish research in this way are often concerned with making research more transparent, more collaborative, more wide-reaching, and more efficient. Open research aims to make both research methods and the resulting data freely available, often via the internet, in order to support reproducibility and, potentially, massively distributed research collaboration. In this regard, it is related to both open source software and citizen science.
Gestion des donnéesLa gestion des données est une discipline de gestion qui tend à valoriser les données en tant que ressources numériques. La gestion des données permet d'envisager le développement d'architectures, de réglementations, de pratiques et de procédures qui gèrent correctement les besoins des organismes sur le plan de tout le cycle de vie des données. Les données sont, avec les traitements, l'un des deux aspects des systèmes d'information traditionnellement identifiés, et l'un ne peut aller sans l'autre pour un management du système d'information cohérent.
Information mutuelleDans la théorie des probabilités et la théorie de l'information, l'information mutuelle de deux variables aléatoires est une quantité mesurant la dépendance statistique de ces variables. Elle se mesure souvent en bit. L'information mutuelle d'un couple de variables représente leur degré de dépendance au sens probabiliste. Ce concept de dépendance logique ne doit pas être confondu avec celui de causalité physique, bien qu'en pratique l'un implique souvent l'autre.
Informations non structuréesLes informations non structurées ou données non structurées sont des données représentées ou stockées sans format prédéfini. Ces informations sont toujours destinées à des humains. Elles sont typiquement constituées de documents textes ou multimédias, mais peuvent également contenir des dates, des nombres et des faits. Cette absence de format entraîne des irrégularités et des ambiguïtés qui peuvent rendre difficile la compréhension des données, contrairement au cas des données stockées dans des tableurs ou des bases de données par exemple, qui sont des informations structurées.
Sociologie informatiqueLa sociologie informatique ou sociologie computationnelle (en anglais computational sociology) est une branche de la sociologie qui consiste à utiliser le calcul pour analyser des phénomènes sociaux. Il s'agit d'utiliser la technique de la simulation sur ordinateur pour la construction de modèles sociaux. Cela implique un certain arrangement des agents sociaux, et des interactions entre eux. Enfin, on examine l'effet de ces interactions sur un agrégat social.
Méthodes quantitativesLes méthodes quantitatives sont des méthodes de recherche, utilisant des outils d'analyse mathématiques et statistiques, en vue de décrire, d'expliquer et prédire des phénomènes par le biais de données historiques sous forme de variables mesurables. Elles se distinguent ainsi des méthodes dites qualitatives. Le comptage et la mesure sont des méthodes quantitatives banales. Le résultat de la recherche est un nombre ou un ensemble de nombres. On les présente souvent sous forme de tables, de graphiques...
Information gain (decision tree)In information theory and machine learning, information gain is a synonym for Kullback–Leibler divergence; the amount of information gained about a random variable or signal from observing another random variable. However, in the context of decision trees, the term is sometimes used synonymously with mutual information, which is the conditional expected value of the Kullback–Leibler divergence of the univariate probability distribution of one variable from the conditional distribution of this variable given the other one.
Research data archivingResearch data archiving is the long-term storage of scholarly research data, including the natural sciences, social sciences, and life sciences. The various academic journals have differing policies regarding how much of their data and methods researchers are required to store in a public archive, and what is actually archived varies widely between different disciplines. Similarly, the major grant-giving institutions have varying attitudes towards public archival of data.
La Structure des révolutions scientifiquesLa Structure des révolutions scientifiques (The Structure of Scientific Revolutions) est un essai rédigé par le philosophe et historien des sciences, Thomas Samuel Kuhn. Paru en 1962, revu en 1970, l'ouvrage est incontestablement son œuvre majeure. Il y modélise notamment la science comme phénomène social et analyse les implications de cette approche, en s'appuyant sur de nombreux exemples tirés de l'Histoire des sciences.