Séance de cours

Annotation des données : collecte et biais dans la PNL

Description

Cette séance de cours se concentre sur les aspects critiques de la collecte de données, l'annotation et les biais qui peuvent survenir dans le traitement du langage naturel (PNL). Il commence par un récapitulatif des techniques de mise au point et des transitions vers limportance de lannotation des données, en soulignant les processus impliqués et les biais potentiels qui peuvent affecter la performance du modèle. Linstructeur discute de limportance des repères dans lévaluation de la performance du modèle, en soulignant que les repères sont souvent construits à partir de jeux de données créés par lhomme, ce qui peut introduire des défauts. La séance de cours décrit les étapes nécessaires à la création de repères efficaces, notamment la définition des tâches, la conception de lignes directrices d'annotation et la garantie de la qualité des données. La discussion couvre également les implications des biais, tels que les corrélations fallacieuses et les artefacts dannotation, qui peuvent conduire à des modèles apprenant des raccourcis plutôt quà une véritable compréhension. La session se termine par une réflexion sur la nécessité de données de haute qualité pour la formation de modèles PNL robustes et les défis actuels dans la création de mesures d'évaluation fiables.

Connectez-vous pour regarder la vidéo

Source officielle

https://mediaspace.epfl.ch/media/0_knas4hnr

À propos de ce résultat

Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.

Annotation des données : collecte et biais dans la PNL

Graph Chatbot

Chattez avec Graph Search