Extraction de connaissancesL'extraction de connaissances est le processus de création de connaissances à partir d'informations structurées (bases de données relationnelles, XML) ou non structurées (textes, documents, images). Le résultat doit être dans un format lisible par les ordinateurs. Le groupe RDB2RDF W3C est en cours de standardisation d'un langage d'extraction de connaissances au format RDF à partir de bases de données. En français on parle d'« extraction de connaissances à partir des données » (ECD).
Information extractionInformation extraction (IE) is the task of automatically extracting structured information from unstructured and/or semi-structured machine-readable documents and other electronically represented sources. In most of the cases this activity concerns processing human language texts by means of natural language processing (NLP). Recent activities in multimedia document processing like automatic annotation and content extraction out of images/audio/video/documents could be seen as information extraction Due to the difficulty of the problem, current approaches to IE (as of 2010) focus on narrowly restricted domains.
Annotation sémantiqueL'annotation sémantique est l'opération consistant à relier le contenu d'un texte à des entités dans une ontologie. Par exemple, pour la phrase «Paris est la capitale de la France.», l'annotation correcte de Paris serait Paris et non Paris Hilton. L'annotation sémantique est une variante plus détaillée mais moins exacte de la méthode des entitiés nommées, car ces dernières décrivent seulement la catégorie de l'entité (Paris est une ville, sans la relier à la bonne page Wikipédia).
CoréférenceEn linguistique, la coréférence est le phénomène qui consiste pour plusieurs syntagmes nominaux (SN) différents contenus dans une phrase ou dans un discours, à désigner la même entité. Par exemple une personne, un lieu, un événement, ou encore une date. Dans la terminologie linguistique, on dit qu'une coréférence est reliée à son antécédent. Pour que les syntagmes se coréférent, les deux expressions doivent porter les mêmes trait-φ. C'est-à-dire qu'ils doivent être en accord en genre, en nombre et en personne.
Pronom personnel en françaisEn grammaire française, le pronom personnel est une catégorie de pronoms servant à désigner les trois types de personnes grammaticales. La classification des pronoms en trois personnes distinctes a été héritée de la culture grecque qui appelait Personae les figurations réalisées par la flexion verbale. Image:PronomPersonnel2Je.png|vignette|Je. Image:PronomPersonnel2Tu.png|vignette|Tu. Image:PronomPersonnel2Il.png|vignette|Il. Image:PronomPersonnel2Elle.png|vignette|Elle. Les trois personnes grammaticales sont : 1.
He (pronoun)In Modern English, he is a singular, masculine, third-person pronoun. In Standard Modern English, he has four shapes representing five distinct word forms: he: the nominative (subjective) form him: the accusative (objective) form (also called the oblique case) his: the dependent and independent genitive (possessive) forms himself: the reflexive form Old English had a single third-person pronoun — from the Proto-Germanic demonstrative base *khi-, from PIE *ko- "this" — which had a plural and three genders in the singular.
Reconnaissance d'entités nomméesLa reconnaissance d'entités nommées est une sous-tâche de l'activité d'extraction d'information dans des corpus documentaires. Elle consiste à rechercher des objets textuels (c'est-à-dire un mot, ou un groupe de mots) catégorisables dans des classes telles que noms de personnes, noms d'organisations ou d'entreprises, noms de lieux, quantités, distances, valeurs, dates, etc. À titre d'exemple, on pourrait donner le texte qui suit, étiqueté par un système de reconnaissance d'entités nommées utilisé lors de la campagne d'évaluation MUC: Henri a acheté 300 actions de la société AMD en 2006 Henri a acheté 300 actions de la société AMD en 2006.
Théorie du liageEn linguistique, la théorie du liage peut désigner toute théorie ayant pour objet la distribution des éléments pronominaux et anaphoriques. Cette théorie offre des restrictions syntaxiques selon la position du syntagme déterminant (ou nominal). L'idée selon laquelle il devrait y avoir une théorie spécialisée et cohérente s'occupant de ces phénomènes particuliers est apparue dans les travaux autour des grammaires transformationnelles dans les années 1970.
Traitement automatique du langage naturelLe traitement automatique du langage naturel (TALN), en anglais natural language processing ou NLP, est un domaine multidisciplinaire impliquant la linguistique, l'informatique et l'intelligence artificielle, qui vise à créer des outils de traitement du langage naturel pour diverses applications. Il ne doit pas être confondu avec la linguistique informatique, qui vise à comprendre les langues au moyen d'outils informatiques.
Pronom réfléchiEn grammaire le pronom réfléchi est un pronom qui se réfère à l’agent d’une action, celui-ci étant d’ordinaire le sujet d’un verbe, et le pronom étant le complément de ce verbe. Dans certaines langues, comme le français ou le roumain, le pronom réfléchi peut aussi se référer à un agent sous-entendu du procès exprimé par un nom, le pronom étant le complément de celui-ci. Dans certaines langues il y a seulement des pronoms réfléchis disjoints, c’est-à-dire accentués et non attachés au verbe, par exemple en anglais ou en hongrois.