Data PreprocessingData preprocessing can refer to manipulation or dropping of data before it is used in order to ensure or enhance performance, and is an important step in the data mining process. The phrase "garbage in, garbage out" is particularly applicable to data mining and machine learning projects. Data collection methods are often loosely controlled, resulting in out-of-range values, impossible data combinations, and missing values, amongst other issues. Analyzing data that has not been carefully screened for such problems can produce misleading results.
Neural networkA neural network can refer to a neural circuit of biological neurons (sometimes also called a biological neural network), a network of artificial neurons or nodes in the case of an artificial neural network. Artificial neural networks are used for solving artificial intelligence (AI) problems; they model connections of biological neurons as weights between nodes. A positive weight reflects an excitatory connection, while negative values mean inhibitory connections. All inputs are modified by a weight and summed.
Haut allemandLe haut allemand (Hochdeutsche Dialekte) est, en linguistique, un groupe de dialectes germaniques. Il se distingue du groupe bas-allemand par le phénomène de la seconde mutation consonantique et en est séparé par la ligne de Benrath. Le nombre total de locuteurs dans sa zone traditionnelle, de Düsseldorf en Allemagne à Bad Radkersburg en Autriche est d'environ 60 millions. Il comprend les dialectes du moyen allemand, où la seconde mutation consonantique est incomplète, et les dialectes de l'allemand supérieur, où cette mutation est complète.
Allemand standardL'allemand standard (Standardhochdeutsch, Standarddeutsch, Hochdeutsch) est la variété standard de la langue allemande utilisée dans des contextes formels pour la communication entre populations utilisant différents dialectes germaniques. L'orthographe est codifiée officiellement par une organisation internationale, le Conseil pour l'orthographe allemande (Rat für deutsche Rechtschreibung). La prononciation est codifiée officieusement dans des manuels. L'allemand standard sert de langue véhiculaire suprarégionale.
Statistique descriptiveLa statistique descriptive est la branche des statistiques qui regroupe les nombreuses techniques utilisées pour décrire un ensemble relativement important de données. L'objectif de la statistique descriptive est de décrire, c'est-à-dire de résumer ou représenter, par des statistiques, les données disponibles quand elles sont nombreuses. Toute description d'un phénomène nécessite d'observer ou de connaître certaines choses sur ce phénomène. Les observations disponibles sont toujours constituées d'ensemble d'observations synchrones.
Réseau neuronal convolutifEn apprentissage automatique, un réseau de neurones convolutifs ou réseau de neurones à convolution (en anglais CNN ou ConvNet pour convolutional neural networks) est un type de réseau de neurones artificiels acycliques (feed-forward), dans lequel le motif de connexion entre les neurones est inspiré par le cortex visuel des animaux. Les neurones de cette région du cerveau sont arrangés de sorte qu'ils correspondent à des régions qui se chevauchent lors du pavage du champ visuel.
German diasporaThe German diaspora consists of German people and their descendants who live outside of Germany. The term is used in particular to refer to the aspects of migration of German speakers from Central Europe to different countries around the world. This definition describes the "German" term as a sociolinguistic group as opposed to the national one since the emigrant groups came from different regions with diverse cultural practices and different varieties of German.
Réseau de neurones récurrentsUn réseau de neurones récurrents (RNN pour recurrent neural network en anglais) est un réseau de neurones artificiels présentant des connexions récurrentes. Un réseau de neurones récurrents est constitué d'unités (neurones) interconnectées interagissant non-linéairement et pour lequel il existe au moins un cycle dans la structure. Les unités sont reliées par des arcs (synapses) qui possèdent un poids. La sortie d'un neurone est une combinaison non linéaire de ses entrées.
Models of neural computationModels of neural computation are attempts to elucidate, in an abstract and mathematical fashion, the core principles that underlie information processing in biological nervous systems, or functional components thereof. This article aims to provide an overview of the most definitive models of neuro-biological computation as well as the tools commonly used to construct and analyze them.
Fouille de textesLa fouille de textes ou « l'extraction de connaissances » dans les textes est une spécialisation de la fouille de données et fait partie du domaine de l'intelligence artificielle. Cette technique est souvent désignée sous l'anglicisme text mining. Elle désigne un ensemble de traitements informatiques consistant à extraire des connaissances selon un critère de nouveauté ou de similarité dans des textes produits par des humains pour des humains.