Littérature persaneLa littérature persane (en ادبیات فارسی) est la littérature écrite en persan. Certains considèrent que la littérature persane inclut les travaux écrits par des Perses en d'autres langues, comme le grec et l'arabe. Le persan est une langue indo-européenne et s'écrit généralement au moyen de l'alphabet perso-arabe, variante de l'alphabet arabe. Les travaux subsistants écrits en langues persanes (comme le vieux-persan ou le moyen-persan) remontent aussi loin qu'en 650 av. J.-C., date des inscriptions achéménides les plus anciennes retrouvées.
Désambiguïsation lexicaleLa désambiguïsation lexicale ou désambigüisation lexicale est la détermination du sens d'un mot dans une phrase lorsque ce mot peut avoir plusieurs sens possibles. Dans la linguistique informatique, la désambiguïsation lexicale est un problème non résolu dans le traitement des langues naturelles et de l'ontologie informatique. La résolution de ce problème permettrait des avancées importantes dans d'autres champs de la linguistique informatique comme l'analyse du discours, l'amélioration de la pertinence des résultats des moteurs de recherche, la résolution des anaphores, la cohérence, l'inférence, etc.
Compréhension du langage naturelvignette|L'apprentissage de la lecture par Sigurður málari, siècle. La compréhension du langage naturel (NLU en anglais) ou linterprétation en langage naturel (NLI) est une sous-rubrique du traitement de la langue naturelle en intelligence artificielle qui traite de la compréhension en lecture automatique. La compréhension du langage naturel est considérée comme un problème difficile en IA. Il existe un intérêt commercial considérable dans ce domaine en raison de son application à la collecte de nouvelles, à la catégorisation des textes, à l'activation vocale, à l'archivage et à l'analyse de contenu à grande échelle.
Génération automatique de textesLa génération automatique de texte (GAT) est une sous discipline de la linguistique computationnelle qui vise à exprimer sous une forme textuelle, syntaxiquement et sémantiquement correcte, une représentation formelle d'un contenu. Outre ses nombreuses applications existantes ou potentielles - par exemple pour produire automatiquement des bulletins météorologiques, ou des rapports automatisés - elle offre par ailleurs un cadre d'investigation des théories linguistiques, et particulièrement de ses mécanismes de production.
PersanLe persan (autonyme : فارسی, fārsī, ou پارسی, Langue|fa-Latn|pārsī) est une langue indo-européenne. C'est la langue officielle et majoritaire de l'Iran (centre, centre-sud, nord-est), de l'Afghanistan et du Tadjikistan. Le persan est une langue notable mais minoritaire au Pakistan, à Bahreïn, en Irak, en Oman, au Qatar et aux Émirats arabes unis. Le dari, dialecte du persan, également appelé persan afghan ou persan oriental, est une langue officielle en Afghanistan ; il est parlé également en Iran et au Pakistan.
Traitement automatique du langage naturelLe traitement automatique du langage naturel (TALN), en anglais natural language processing ou NLP, est un domaine multidisciplinaire impliquant la linguistique, l'informatique et l'intelligence artificielle, qui vise à créer des outils de traitement du langage naturel pour diverses applications. Il ne doit pas être confondu avec la linguistique informatique, qui vise à comprendre les langues au moyen d'outils informatiques.
Mort d'une langueEn linguistique, la mort d'une langue survient quand disparaissent les d'une langue maternelle. Par extension, lextinction d'une langue est le stade où cette langue n'est plus connue, pas même comme langue seconde. D'autres termes proches sont le linguicide, c'est-à-dire la mort d'une langue pour des motifs naturels ou politiques et, plus rarement, la « glottophagie », phénomène où une langue peu parlée est absorbée ou remplacée par une autre, comptant des locuteurs plus nombreux.
LangageLe langage est la capacité d'exprimer une pensée et de communiquer au moyen d'un système de signes (vocaux, gestuel, graphiques, tactiles, olfactifs, etc.) doté d'une sémantique, et le plus souvent d'une syntaxe — mais ce n'est pas systématique (la cartographie est un exemple de langage non syntaxique). Fruit d'une acquisition, la langue est une des nombreuses manifestations du langage. Les langages sont constitués de signaux correspondant au support physique de l'information.
TadjikLe tadjik (nom local : ; cyrillique : Тоҷикӣ, translittération ISO-9 : toçiki ou Форсии Тоҷикӣ, translittération : forsii toçiki ; écriture latine : todžikī ; alphabet perso-arabe : تاجکی, translittération : tôjikī ; ) est la variété du persan parlée au Tadjikistan. C'est une langue appartenant au groupe iranien de la famille des langues indo-européennes ; elle est très similaire au dari, qui est lui-même une variété du persan. Le tadjik est parlé en Asie centrale au Tadjikistan, dont il est la langue officielle.
Langue éteinteUne langue éteinte ou finie est une langue qui n'a plus de locuteurs natifs. Cela se produit généralement lorsqu'une langue est sujette à l' extinction linguistique et est directement remplacée par une autre langue, par exemple le copte remplacé par l'arabe et de nombreuses langues amérindiennes, remplacé par l'anglais, le français, l'espagnol et le portugais . Le terme « langue morte » se réfère aussi couramment à une langue plus ancienne qui a considérablement changé et a évolué vers un nouveau groupe linguistique autonome, dont le processus de séparation linguistique est maintenant terminé.