MotUn mot est une suite de sons ou de caractères graphiques formant une unité sémantique et pouvant être distingués par un séparateur, par exemple un blanc typographique à l'écrit. En linguistique, un mot est le plus petit élément pouvant être prononcé isolément avec un contenu sémantique ou pragmatique. « Mot » dérive du bas-latin muttum, substantif issu du verbe latin muttire. Ce verbe indique généralement la production d'un discours inarticulé et/ou incohérent : au sens propre, muttire, c'est dire « mu », grogner comme un bovin.
Propriété de Markovvignette|Exemple de processus stochastique vérifiant la propriété de Markov: un mouvement Brownien (ici représenté en 3D) d'une particule dont la position à un instant t+1 ne dépend que de la position précédente à l'instant t. En probabilité, un processus stochastique vérifie la propriété de Markov si et seulement si la distribution conditionnelle de probabilité des états futurs, étant donnés les états passés et l'état présent, ne dépend en fait que de l'état présent et non pas des états passés (absence de « mémoire »).
Distance de LevenshteinLa 'distance de Levenshtein' est une distance, au sens mathématique du terme, donnant une mesure de la différence entre deux chaînes de caractères. Elle est égale au nombre minimal de caractères qu'il faut supprimer, insérer ou remplacer pour passer d’une chaîne à l’autre. Elle a été proposée par Vladimir Levenshtein en 1965. Elle est également connue sous les noms de distance d'édition ou de déformation dynamique temporelle, notamment en reconnaissance de formes et particulièrement en reconnaissance vocale.
Prescriptivisme linguistiqueLe prescriptivisme linguistique, ou grammaire prescriptive, est l'établissement de règles définissant l'usage jugé correct de la langue. Ces règles peuvent porter sur des aspects linguistiques tels que l'orthographe, la prononciation, le vocabulaire, la syntaxe et la sémantique. Souvent liées au purisme linguistique, ces pratiques normatives sous-entendent que certains usages sont incorrects, incohérents, illogiques, peu compréhensibles, voire laids ; ce même dans les cas où les usages ainsi décriés sont plus courants que l'usage prescrit.
Inférence statistiquevignette|Illustration des 4 principales étapes de l'inférence statistique L'inférence statistique est l'ensemble des techniques permettant d'induire les caractéristiques d'un groupe général (la population) à partir de celles d'un groupe particulier (l'échantillon), en fournissant une mesure de la certitude de la prédiction : la probabilité d'erreur. Strictement, l'inférence s'applique à l'ensemble des membres (pris comme un tout) de la population représentée par l'échantillon, et non pas à tel ou tel membre particulier de cette population.
Langue standardUne langue standard résulte de l'élaboration planifiée pour une langue d'une variété de référence unitaire, à partir d'un de ses dialectes ou d'un diasystème. Cette variété est utilisée pour l'enseignement, l'usage officiel et l'écrit soutenu. Ces éléments visent à donner une cohérence culturelle, politique et sociale à un territoire où la langue standardisée est officielle ou nationale.
Markov information sourceIn mathematics, a Markov information source, or simply, a Markov source, is an information source whose underlying dynamics are given by a stationary finite Markov chain. An information source is a sequence of random variables ranging over a finite alphabet , having a stationary distribution. A Markov information source is then a (stationary) Markov chain , together with a function that maps states in the Markov chain to letters in the alphabet .
Alphabet arménienL’alphabet arménien est l’alphabet utilisé pour écrire l’arménien. L'alphabet arménien compte trente-huit caractères (trente-six à l'origine, trente-huit dès le ). Comme l'alphabet grec duquel il serait en partie inspiré, il fait partie des écritures bicamérales (il possède des minuscules et des capitales). L'arménien fait partie des langues indo-européennes. Il est parlé en Arménie et par les communautés arméniennes du monde entier ; on distingue l'arménien oriental, celui généralement parlé en Arménie, et l'arménien occidental, qui est en déclin.
Distance d'édition sur les arbresEn informatique théorique, en biochimie et aussi dans des applications, en vision par ordinateur par exemple, la distance d'édition d'arbres (en anglais tree edit distance) est une mesure qui évalue, en termes de nombre de transformations élémentaires, le nombre d'opérations nécessaires et leur coût pour passer d'un arbre à un autre. C'est une notion qui étend, aux arbres, la distance d'édition (ou distance de Levenshtein) entre chaînes de caractères.
Inférence bayésiennevignette|Illustration comparant les approches fréquentiste et bayésienne (Christophe Michel, 2018). L’inférence bayésienne est une méthode d'inférence statistique par laquelle on calcule les probabilités de diverses causes hypothétiques à partir de l'observation d'événements connus. Elle s'appuie principalement sur le théorème de Bayes. Le raisonnement bayésien construit, à partir d'observations, une probabilité de la cause d'un type d'événements.