Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre la reconnaissance d'entités nommées (NER), une tâche axée sur l'identification et la classification des noms de personnes, d'organisations, de lieux et plus encore dans les documents. Il explore les utilisations de NER, telles que l'indexation et l'attribution des sentiments, ainsi que des outils commerciaux comme OpenCalais de Reuters et des bibliothèques Python comme NLTK NER et Spacy. La séance de cours se penche sur NER à la fois comme une tâche d'étiquetage et de classification de séquence, discutant des fonctionnalités utilisées dans NER comme des balises de partie de discours et des formes de mots. Il examine également limportance du contexte dans NER et introduit des techniques telles que les modèles probabilistes génératifs et les modèles de Markov cachés. L'algorithme de Viterbi pour le marquage de séquence est expliqué, soulignant son approche de programmation dynamique. La séance de cours se termine par un quiz sur l'algorithme de Viterbi et l'adéquation des modèles HMM pour différentes tâches.