Science des donnéesLa science des données est l'étude de l’extraction automatisée de connaissance à partir de grands ensembles de données. Plus précisément, la science des données est un domaine interdisciplinaire qui utilise des méthodes, des processus, des algorithmes et des systèmes scientifiques pour extraire des connaissances et des idées à partir de nombreuses données structurées ou non . Elle est souvent associée aux données massives et à l'analyse des données.
Nettoyage de donnéesLe nettoyage de données est l'opération de détection et de correction (ou suppression) d'erreurs présentes sur des données stockées dans des bases de données ou dans des fichiers. Le nettoyage de données est un des problèmes majeurs des entrepôts de données. Les données présentes dans les bases de données peuvent avoir plusieurs types d'erreurs comme des erreurs de frappe, des informations manquantes, des imprécisions etc. La partie impropre de la donnée traitée peut être remplacée, modifiée ou supprimée.
Nitrurevignette|redresse=1.5|Mèche en acier durcie par un revêtement de nitrure de titane. Les nitrures sont des composés où l'azote est au nombre d'oxydation –III. Ils constituent une large famille dont certains représentants ont des applications concrètes comme le nitrure de titane dont la dureté est mise à profit pour renforcer certains outils. L'ion N est isoélectronique de l'ion oxyde O et de l'ion fluorure F. Il existe des nitrures ioniques ( où M = Be, Mg, Ca) et des nitrures covalents (, ).
Bande interditeredresse=.9|vignette|Bandes d'un semiconducteur. La bande interdite d'un matériau, ou gap, est l'intervalle, situé entre la bande de valence et la bande de conduction, dans lequel la densité d'états électroniques est nulle, de sorte qu'on n'y trouve pas de niveau d'énergie électronique. La largeur de bande interdite, ou band gap en anglais, est une caractéristique fondamentale des matériaux semiconducteurs ; souvent notée , elle est généralement exprimée en électronvolts (eV). Fichier:Band filling diagram.
Data collectionData collection or data gathering is the process of gathering and measuring information on targeted variables in an established system, which then enables one to answer relevant questions and evaluate outcomes. Data collection is a research component in all study fields, including physical and social sciences, humanities, and business. While methods vary by discipline, the emphasis on ensuring accurate and honest collection remains the same.
Data PreprocessingData preprocessing can refer to manipulation or dropping of data before it is used in order to ensure or enhance performance, and is an important step in the data mining process. The phrase "garbage in, garbage out" is particularly applicable to data mining and machine learning projects. Data collection methods are often loosely controlled, resulting in out-of-range values, impossible data combinations, and missing values, amongst other issues. Analyzing data that has not been carefully screened for such problems can produce misleading results.
Méthode quantique semi-empiriqueLes méthodes semi-empiriques sont des techniques de résolution de l'équation de Schrödinger de systèmes à plusieurs électrons. Contrairement aux méthodes ab initio, les méthodes semi-empiriques utilisent des données ajustées sur des résultats expérimentaux afin de simplifier les calculs. La longueur et la difficulté des calculs est en grande partie due aux intégrales biélectroniques qui apparaissent au cours du processus de résolution.
Semi-conducteur à large bandevignette|Schéma d'un semi-conducteur à large bande Un semi-conducteur à large bande est un semi-conducteur dont la largeur de la bande interdite, entre la bande de valence et la bande de conduction, est significativement plus importante que celle du silicium. Le seuil exact dépend du domaine d'utilisation. Commercialement, du fait de ses caractéristiques et de son abondance, le silicium est le semi-conducteur le plus utilisé. Les composants électroniques basés sur le silicium peuvent cependant présenter des limites fonctionnelles.
Nitrure de siliciumLe nitrure de silicium est un composé chimique de formule . On le connaît à l'état naturel (un minéral nommé nierite) depuis 1995, sous la forme de petites inclusions dans certaines météorites. Il s'agit d'une céramique blanche plutôt légère ( selon la compacité du matériau), très dure (8,5 sur l'échelle de Mohs), relativement inerte chimiquement (attaquée par l'acide fluorhydrique HF dilué et l'acide sulfurique à chaud), et demeurant stable thermiquement jusqu'à .
Partitionnement de donnéesvignette|upright=1.2|Exemple de clustering hiérarchique. Le partitionnement de données (ou data clustering en anglais) est une méthode en analyse des données. Elle vise à diviser un ensemble de données en différents « paquets » homogènes, en ce sens que les données de chaque sous-ensemble partagent des caractéristiques communes, qui correspondent le plus souvent à des critères de proximité (similarité informatique) que l'on définit en introduisant des mesures et classes de distance entre objets.