Concept

Désambiguïsation lexicale

La désambiguïsation lexicale ou désambigüisation lexicale est la détermination du sens d'un mot dans une phrase lorsque ce mot peut avoir plusieurs sens possibles. Dans la linguistique informatique, la désambiguïsation lexicale est un problème non résolu dans le traitement des langues naturelles et de l'ontologie informatique. La résolution de ce problème permettrait des avancées importantes dans d'autres champs de la linguistique informatique comme l'analyse du discours, l'amélioration de la pertinence des résultats des moteurs de recherche, la résolution des anaphores, la cohérence, l'inférence, etc. Le cerveau humain est très habile pour désambiguïser les sens des mots. Le fait que les langues naturelles demandent souvent l'emploi de cette faculté est un reflet de l'habilité du cerveau dans ce domaine. Autrement dit, la mode de développement des langues humaines reflète (et a contribué à former) la capacité innée des réseaux de neurones du cerveau. Par contre, depuis longtemps, le traitement des langues naturelles et l'apprentissage automatique ont posé un défi à l'informatique. Le progrès ininterrompu des recherches a amené des systèmes qui atteignent des niveaux satisfaisants de certitude en adressant des classes variées de paroles et d'ambiguïtés. Des méthodes très variées ont été évaluées, y compris des méthodes basées sur un dictionnaire qui utilisent l'information contenue dans des ressources lexicales ; des méthodes d'apprentissage automatique supervisé où chaque parole distincte a un étiqueteur à elle ; des méthodes d'apprentissage automatique tout à fait non supervisées qui partitionnent des instances d'un mot, ainsi induisant des sens de ce mot. Les algorithmes les plus performants jusqu'à présent ont été les méthodes d'apprentissage automatique supervisé. La désambiguïsation lexicale a été formulée pour la première fois en tant que tâche potentiellement exécutable par un ordinateur dans les premiers jours de la traduction automatique, ce qui en fait l'un des plus vieux problèmes de la linguistique computationnelle.

Source officielle

https://fr.wikipedia.org/wiki/Désambiguïsation_lexicale

À propos de ce résultat

Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.

Cours associés (13)

CS-423: Distributed information systems

This course introduces the foundations of information retrieval, data mining and knowledge bases, which constitute the foundations of today's Web-based distributed information systems.

EE-608: Deep Learning For Natural Language Processing

The Deep Learning for NLP course provides an overview of neural network based methods applied to text. The focus is on models particularly suited to the properties of human language, such as categori

ENV-367: Environmental and construction law

Ce cours donne aux étudiant-e-s les connaissances de base nécessaires pour comprendre les dimensions juridiques de leur activité professionnelle concernant l'aménagement du territoire et la protection

Afficher plus

Publications associées (29)

Generalization and Personalization of Machine Learning for Multimodal Mobile Sensing in Everyday Life

Lakmal Buddika Meegahapola

A range of behavioral and contextual factors, including eating and drinking behavior, mood, social context, and other daily activities, can significantly impact an individual's quality of life and overall well-being. Therefore, inferring everyday life aspe ...

EPFL2024

Advancing Self-Supervised Deep Learning for 3D Scene Understanding

Seyed Mohammad Mahdi Johari

Recent advancements in deep learning have revolutionized 3D computer vision, enabling the extraction of intricate 3D information from 2D images and video sequences. This thesis explores the application of deep learning in three crucial challenges of 3D com ...

EPFL2024

Climatic Affinities or Type As A Structure Of Relations, Based On Typological Transfer In The Work Of Lacaton & Vassal And Other Similar Precedents

Tiago André Pratas Borges

It is a generally accepted idea that typology is an essential element in the disciplinary dimension of architecture. The concept of typology, in its most common definition, is sufficiently malleable to cover a wide range of uses, but it is also this vaguen ...

2023

Afficher plus

Personnes associées (4)

Andrei Popescu-Belis

Rémi Philippe Lebret

Karl Aberer

Co-Founder of LinkAlong Sarl, 2017.Vice-president EPFL for Information Systems, 2012 –2016.Director of the Swiss National Centre for Mobile Information and Communication Systems NCCR MICS (mics.ch), 2005 -2012.Member of the Swiss Research and Technology Council SWTR, consulting the Swiss Federal government, 2004 - 2011.

Afficher plus

Unités associées (2)

Laboratoire de systèmes d'information répartis

Laboratoire de l'IDIAP

Source officielle

https://fr.wikipedia.org/wiki/Désambiguïsation_lexicale

À propos de ce résultat

Proximité ontologique

Information engineering

Traitement automatique du langage naturel: Traitement automatique du langage naturel

Cours associés (13)

CS-423: Distributed information systems

This course introduces the foundations of information retrieval, data mining and knowledge bases, which constitute the foundations of today's Web-based distributed information systems.

EE-608: Deep Learning For Natural Language Processing

The Deep Learning for NLP course provides an overview of neural network based methods applied to text. The focus is on models particularly suited to the properties of human language, such as categori

ENV-367: Environmental and construction law

Afficher plus

Séances de cours associées (31)

Indexation sémantique latente

Couvre l'indexation sémantique latente, l'intégration de mots, et le modèle de skipgram avec un échantillonnage négatif.

Word Embeddings: Modélisation du contexte et de la similarité des mots

Couvre les encastrements de mots, la modélisation du contexte des mots et la similitude dans un espace de faible dimension.

Formation des classificateurs de sentiments binaires

Couvre la formation d'un classificateur de sentiment binaire à l'aide d'un RNN.

Afficher plus

Publications associées (29)

Generalization and Personalization of Machine Learning for Multimodal Mobile Sensing in Everyday Life

Lakmal Buddika Meegahapola

EPFL2024

Advancing Self-Supervised Deep Learning for 3D Scene Understanding

Seyed Mohammad Mahdi Johari

EPFL2024

Climatic Affinities or Type As A Structure Of Relations, Based On Typological Transfer In The Work Of Lacaton & Vassal And Other Similar Precedents

Tiago André Pratas Borges

2023

Afficher plus

Personnes associées (4)

Unités associées (2)

Laboratoire de systèmes d'information répartis

Laboratoire de l'IDIAP

Concepts associés (23)

Word sense

In linguistics, a word sense is one of the meanings of a word. For example, a dictionary may have over 50 different senses of the word "play", each of these having a different meaning based on the context of the word's usage in a sentence, as follows: We went to see the play Romeo and Juliet at the theater. The coach devised a great play that put the visiting team on the defensive. The children went out to play in the park. In each sentence different collocates of "play" signal its different meanings.

Étiquetage morpho-syntaxique

vignette|C’est une image en language italien En linguistique, l'étiquetage morpho-syntaxique (aussi appelé étiquetage grammatical, POS tagging (part-of-speech tagging) en anglais) est le processus qui consiste à associer aux mots d'un texte les informations grammaticales correspondantes comme la partie du discours, le genre, le nombre, etc. à l'aide d'un outil informatique. Texte original : Nous sommes allées en Bretagne contempler de magnifiques allées couvertes du Néolithique.

Analyse sémantique latente

L’analyse sémantique latente (LSA, de l'anglais : Latent semantic analysis) ou indexation sémantique latente (ou LSI, de l'anglais : Latent semantic indexation) est un procédé de traitement des langues naturelles, dans le cadre de la sémantique vectorielle. La LSA fut brevetée en 1988 et publiée en 1990. Elle permet d'établir des relations entre un ensemble de documents et les termes qu'ils contiennent, en construisant des « concepts » liés aux documents et aux termes.

Afficher plus