Analyse des donnéesL’analyse des données (aussi appelée analyse exploratoire des données ou AED) est une famille de méthodes statistiques dont les principales caractéristiques sont d'être multidimensionnelles et descriptives. Dans l'acception française, la terminologie « analyse des données » désigne donc un sous-ensemble de ce qui est appelé plus généralement la statistique multivariée. Certaines méthodes, pour la plupart géométriques, aident à faire ressortir les relations pouvant exister entre les différentes données et à en tirer une information statistique qui permet de décrire de façon plus succincte les principales informations contenues dans ces données.
Chaîne de Markovvignette|Exemple élémentaire de chaîne de Markov, à deux états A et E. Les flèches indiquent les probabilités de transition d'un état à un autre. En mathématiques, une chaîne de Markov est un processus de Markov à temps discret, ou à temps continu et à espace d'états discret. Un processus de Markov est un processus stochastique possédant la propriété de Markov : l'information utile pour la prédiction du futur est entièrement contenue dans l'état présent du processus et n'est pas dépendante des états antérieurs (le système n'a pas de « mémoire »).
LexiqueLe lexique d'une langue est l'ensemble de ses mots (somme des vocabulaires utilisés), ou de façon plus précise en linguistique de ses lemmes. Les mots d'un lexique forment un tout, une sorte de système sémantique, qui évolue donc au fil du temps. Les rapports entre les mots, de forme et surtout de sens, ainsi qu'entre les sens d'un même mot, sont très divers. La taille d'un lexique est très variable et dépend notamment de la diversité des domaines de connaissance ou techniques qu'elle permet d'exprimer.
Linguistique théoriqueLa linguistique théorique est la branche de la linguistique qui s'occupe de modéliser la connaissance linguistique. Cette approche implique la recherche et l'explication des universaux linguistiques, qui sont des propriétés que toutes les langues ont en commun. Les champs d'étude généralement considérés comme le noyau de la linguistique théorique sont la syntaxe, la phonologie, la morphologie et la sémantique. La phonologie est souvent confondue avec la phonétique, qui comme la psycholinguistique et la sociolinguistique, sont rarement considérées comme faisant partie de la linguistique théorique.
Communauté linguistiqueUne communauté linguistique est un groupe de personnes qui utilisent le même outil linguistique pour communiquer. Cet outil linguistique est une langue ou un dialecte partagé. Puisque ce concept est principalement associé à la sociolinguistique et l'anthropologie linguistique, sa définition est débattue dans la littérature. Les définitions d'une communauté linguistique ont tendance à accorder des différents niveaux d'importance par rapport aux points suivants : Appartenance à la communauté partagée ; Communication linguistique partagée.