AllemandLallemand (autonyme : Deutsch, ) est l'une des langues indo-européennes appartenant à la branche famille des langues germaniques. Du fait de ses nombreux dialectes, l'allemand constitue dans une certaine mesure une langue-toit (Dachsprache). Son histoire, en tant que langue distincte des autres langues germaniques occidentales, débute au haut Moyen Âge, lors de la seconde mutation consonantique.
Résumé automatique de texteUn résumé est une forme de compression textuelle avec perte d'information. Un résumé automatique de texte est une version condensée d'un document textuel, obtenu au moyen de techniques informatiques. La forme la plus connue et la plus visible des condensés de textes est le résumé, représentation abrégée et exacte du contenu d'un document. Cependant, produire un résumé pertinent et de qualité demande au résumeur (un humain ou un système automatique) l'effort de sélectionner, d'évaluer, d'organiser et d'assembler des segments d'information selon leur pertinence.
GermanistiqueLa germanistique (Germanistik) consiste principalement en l'étude de la langue et de la littérature allemandes au niveau des études supérieures. Par extension, la discipline (nommée Germanistik en allemand) étudie l'histoire des langues germaniques et des différentes littératures de l'aire germanophone concernées. En France, la germanistique étudie aussi la culture allemande en général. Il faut distinguer la Germanistik telle qu'elle est étudiée en Allemagne et la « germanistique » française.
German dialectsGerman dialects are the various traditional local varieties of the German language. Though varied by region, those of the southern half of Germany beneath the Benrath line are dominated by the geographical spread of the High German consonant shift, and the dialect continuum that connects German to the neighboring varieties of Low Franconian (Dutch) and Frisian. The varieties of German are conventionally grouped into Upper German, Central German and Low German; Upper and Central German form the High German subgroup.
Haut allemandLe haut allemand (Hochdeutsche Dialekte) est, en linguistique, un groupe de dialectes germaniques. Il se distingue du groupe bas-allemand par le phénomène de la seconde mutation consonantique et en est séparé par la ligne de Benrath. Le nombre total de locuteurs dans sa zone traditionnelle, de Düsseldorf en Allemagne à Bad Radkersburg en Autriche est d'environ 60 millions. Il comprend les dialectes du moyen allemand, où la seconde mutation consonantique est incomplète, et les dialectes de l'allemand supérieur, où cette mutation est complète.
Allemand standardL'allemand standard (Standardhochdeutsch, Standarddeutsch, Hochdeutsch) est la variété standard de la langue allemande utilisée dans des contextes formels pour la communication entre populations utilisant différents dialectes germaniques. L'orthographe est codifiée officiellement par une organisation internationale, le Conseil pour l'orthographe allemande (Rat für deutsche Rechtschreibung). La prononciation est codifiée officieusement dans des manuels. L'allemand standard sert de langue véhiculaire suprarégionale.
Fouille de textesLa fouille de textes ou « l'extraction de connaissances » dans les textes est une spécialisation de la fouille de données et fait partie du domaine de l'intelligence artificielle. Cette technique est souvent désignée sous l'anglicisme text mining. Elle désigne un ensemble de traitements informatiques consistant à extraire des connaissances selon un critère de nouveauté ou de similarité dans des textes produits par des humains pour des humains.
German diasporaThe German diaspora consists of German people and their descendants who live outside of Germany. The term is used in particular to refer to the aspects of migration of German speakers from Central Europe to different countries around the world. This definition describes the "German" term as a sociolinguistic group as opposed to the national one since the emigrant groups came from different regions with diverse cultural practices and different varieties of German.
SemEvalSemEval (Semantic Evaluation) is an ongoing series of evaluations of computational semantic analysis systems; it evolved from the Senseval word sense evaluation series. The evaluations are intended to explore the nature of meaning in language. While meaning is intuitive to humans, transferring those intuitions to computational analysis has proved elusive. This series of evaluations is providing a mechanism to characterize in more precise terms exactly what is necessary to compute in meaning.
Traitement automatique du langage naturelLe traitement automatique du langage naturel (TALN), en anglais natural language processing ou NLP, est un domaine multidisciplinaire impliquant la linguistique, l'informatique et l'intelligence artificielle, qui vise à créer des outils de traitement du langage naturel pour diverses applications. Il ne doit pas être confondu avec la linguistique informatique, qui vise à comprendre les langues au moyen d'outils informatiques.