GrammaireLa grammaire est l'étude objective et systématique des éléments (phonème, morphème et mot) et des mécanismes et processus de formation, de construction et d'expression constitutifs d'une langue naturelle, écrite ou parlée, en particulier par l'étude de la morphologie et de la syntaxe et à l'exclusion de la phonologie, de la lexicologie, de la sémantique et de la stylistique. Par extension, on nomme aussi grammaire un manuel ou un ensemble de documents décrivant des règles grammaticales.
Morphologie (linguistique)En linguistique, la morphologie (cf. les mots grecs morphé « forme » + lógos « étude ») est traditionnellement la branche de la grammaire qui étudie la forme des mots, par opposition à la syntaxe, qui s’occupe de la fonction des mots et d’entités plus grandes que ceux-ci. En d’autres termes, la morphologie étudie les paradigmes des mots et l’organisation des traits grammaticaux, alors que la syntaxe traite des successions de mots, des relations syntagmatiques.
Diacritiques de l'alphabet arabeL'alphabet arabe n'utilise habituellement pas de diacritiques, hormis les points souscrits ou suscrits obligatoires pour distinguer des lettres ambiguës. Cependant, dans un cadre didactique ou religieux, de nombreux signes auxiliaires peuvent rendre le texte moins ambigu. L'arabe ne notant normalement pas les voyelles brèves, par exemple, ni les géminations ou encore les assimilations, il n'est pas possible de lire à voix haute un texte sans l'aide de ces signes pour un lecteur débutant n'ayant pas une bonne connaissance de la langue.
Alphabet de tchat arabeL’alphabet de tchat arabe, aussi appelé arabi (ʿArabī), arabizi (ʿArabīzī), mu’arrab (Muʿarrab), franco-arabe ou franco, est un alphabet utilisé pour communiquer en arabe sur Internet et plus précisément dans le cadre de la messagerie instantanée. Cet alphabet est le résultat du procédé de romanisation de l'arabe. Chaque caractère se prononce toujours de la même façon, quel que soit le caractère qui le précède ou qui le suit. La prononciation de certains graphèmes peut toutefois différer selon le dialecte employé.
Langues romanesLes langues romanes, aussi appelées langues latines ou encore langues néo-latines, sont un groupe de langues issues du latin vulgaire, plus précisément du latin véhiculaire. Utilisés pour la communication sur toute l'étendue de l'Empire romain, le latin véhiculaire a évolué en plusieurs langues romanes dont trois : le castillan, le français et le portugais, ont connu une expansion mondiale à partir du . La distinction entre langue et dialecte étant assez arbitraire, on peut définir d'une vingtaine à une cinquantaine de langues romanes.
Linkless embeddingIn topological graph theory, a mathematical discipline, a linkless embedding of an undirected graph is an embedding of the graph into three-dimensional Euclidean space in such a way that no two cycles of the graph are linked. A flat embedding is an embedding with the property that every cycle is the boundary of a topological disk whose interior is disjoint from the graph. A linklessly embeddable graph is a graph that has a linkless or flat embedding; these graphs form a three-dimensional analogue of the planar graphs.
Automate fini non déterministeUn automate fini (on dit parfois, par une traduction littérale de l'anglais, machine à états finis, au lieu de machine avec un nombre fini d'états ou machine à états finie ou machine finie à états), finite-state automaton ou finite-state machine (FSA, FSM), est une machine abstraite qui est un outil fondamental en mathématiques discrètes et en informatique. On les retrouve dans la modélisation de processus, le contrôle, les protocoles de communication, la vérification de programmes, la théorie de la calculabilité, dans l'étude des langages formels et en compilation.
Extraction terminologiqueL'extraction terminologique est une application du traitement automatique du langage naturel qui consiste à extraire automatiquement une liste de termes à partir d'un corpus spécialisé. Les logiciels réalisant l'extraction terminologique sont appelés extracteurs de termes. Les termes extraits par l'extracteur de termes peuvent être utilisés de plusieurs façons : Terminologie assistée par ordinateur : Dans ce cas, l'extracteur de termes aide le terminologue dans sa tâche en lui "prémâchant" le travail.
Graphe orientéthumb|Un graphe orienté .(Figure 1) Dans la théorie des graphes, un graphe orienté est un couple formé de un ensemble, appelé ensemble de nœuds et un ensemble appelé ensemble d'arêtes. Les arêtes sont alors nommées arcs, chaque arête étant un couple de noeuds, représenté par une flèche. Étant donné un arc , on dit que est l'origine (ou la source ou le départ ou le début) de et que est la cible (ou l'arrivée ou la fin) de . Le demi-degré extérieur (degré sortant) d'un nœud, noté , est le nombre d'arcs ayant ce nœud pour origine.
Compréhension du langage naturelvignette|L'apprentissage de la lecture par Sigurður málari, siècle. La compréhension du langage naturel (NLU en anglais) ou linterprétation en langage naturel (NLI) est une sous-rubrique du traitement de la langue naturelle en intelligence artificielle qui traite de la compréhension en lecture automatique. La compréhension du langage naturel est considérée comme un problème difficile en IA. Il existe un intérêt commercial considérable dans ce domaine en raison de son application à la collecte de nouvelles, à la catégorisation des textes, à l'activation vocale, à l'archivage et à l'analyse de contenu à grande échelle.