MATLABMATLAB (« matrix laboratory ») est un langage de script émulé par un environnement de développement du même nom ; il est utilisé à des fins de calcul numérique. Développé par la société The MathWorks, MATLAB permet de manipuler des matrices, d'afficher des courbes et des données, de mettre en œuvre des algorithmes, de créer des interfaces utilisateurs, et peut s’interfacer avec d’autres langages comme le C, C++, Java, et Fortran.
Modèle de donnéesEn informatique, un modèle de données est un modèle qui décrit la manière dont sont représentées les données dans une organisation métier, un système d'information ou une base de données. Le terme modèle de données peut avoir deux significations : Un modèle de données théorique, c'est-à-dire une description formelle ou un modèle mathématique. Voir aussi modèle de base de données Un modèle de données instance, c'est-à-dire qui applique un modèle de données théorique (modélisation des données) pour créer un modèle de données instance.
Données brutesLes données brutes (aussi connu comme données primaires) sont les données non interprétées émanant d'une source primaire, ayant des caractéristiques liées à celle-ci et qui n'ont été soumises à aucun traitement ou toute autre manipulation. Les données brutes peuvent être entrées dans un programme informatique ou utilisées dans des procédures manuelles telles que l'analyse statistique d'une enquête. Il peut s'agir des données binaires des périphériques de stockage électroniques comme les lecteurs de disque dur.
7-Zip7-Zip est un logiciel de compression de données et d’archivage de fichiers fonctionnant sous Windows développé par Igor Pavlov. Il peut également être utilisé avec d’autres systèmes d’exploitation (GNU/Linux...) grâce, par exemple, au projet Wine ou au portage de sa version console sous GNU/Linux, nommé p7zip. C’est un logiciel libre distribué sous licence LGPL, le code LZMA est dans le domaine public, le code AES est sous licence BSD et le code unRAR est sous licence mixte (LGPL + des restrictions unRAR).
Centre de donnéesvignette|Centre de traitement de données. Un centre de données (en anglais data center ou data centre), ou centre informatique est un lieu (et un service) où sont regroupés les équipements constituants d'un système d'information (ordinateurs centraux, serveurs, baies de stockage, équipements réseaux et de télécommunications). Ce regroupement permet de faciliter la sécurisation, la gestion (notamment l'exécution de calculs et le refroidissement) et la maintenance des équipements et des données stockées.
Particules indiscernablesLes particules indiscernables ou particules identiques sont des particules qui ne peuvent être différenciées l'une de l'autre, même en principe. Ce concept prend tout son sens en mécanique quantique, où les particules n'ont pas de trajectoire bien définie qui permettrait de les distinguer l'une de l'autre. Les particules indiscernables peuvent être soit des particules élémentaires telles que l'électron ou le photon, ou des particules composites - neutron, proton - ayant le même état interne.
Explorateur de fichiersExplorateur de fichiers (), précédemment l'Explorateur Windows () est le gestionnaire de fichiers fourni avec le système d'exploitation Microsoft Windows. Le gestionnaire permet, notamment, d'afficher et de modifier le nom des fichiers et des dossiers, de manipuler les fichiers et les dossiers (copier, déplacer, effacer), d'ouvrir les fichiers de données, et de lancer les programmes. L'Explorateur Windows est également le programme qui affiche le bureau de Microsoft Windows, notamment la barre des tâches et le menu Démarrer.
Surapprentissagevignette|300x300px|La ligne verte représente un modèle surappris et la ligne noire représente un modèle régulier. La ligne verte classifie trop parfaitement les données d'entrainement, elle généralise mal et donnera de mauvaises prévisions futures avec de nouvelles données. Le modèle vert est donc finalement moins bon que le noir. En statistique, le surapprentissage, ou sur-ajustement, ou encore surinterprétation (en anglais « overfitting »), est une analyse statistique qui correspond trop précisément à une collection particulière d'un ensemble de données.
Lac de donnéesUn lac de données (en anglais data lake) est une méthode de stockage de données massives utilisée par le big data (mégadonnées en français). Ces données sont gardées dans leurs formats originaux ou sont très peu transformées. Le lac de données donne la priorité au stockage rapide et volumineux de données hétérogènes en adoptant une architecture en cluster. Il n'est pas optimisé pour les requêtes SQL comme les SGBD relationnels classiques, et s'écarte des Propriétés ACID traditionnelles. On parle depuis 2010 de SGBD NoSQL.
RAW (format d'image)thumb|Fonctionnement de la matrice de Bayer. Raw est la désignation générique d'un type de fichier d' issues d’appareils photo numériques ou de scanners. Un fichier Raw contient les données brutes du capteur et les paramètres nécessaires à la transformation en fichier image visible sur écran. Le fichier est plus volumineux que celui au format JPEG, servant le plus souvent à la communication des images, mais il n'a pas subi de transformations irréversibles, ce qui permet de retravailler sans dommage.