Grand modèle de langageUn grand modèle de langage, grand modèle linguistique, grand modèle de langue, modèle massif de langage ou encore modèle de langage de grande taille (LLM, pour l'anglais large language model) est un modèle de langage possédant un grand nombre de paramètres (généralement de l'ordre du milliard de poids ou plus). Ce sont des réseaux de neurones profonds entraînés sur de grandes quantités de texte non étiqueté utilisant l'apprentissage auto-supervisé ou l'apprentissage semi-supervisé.
Psychologie de l'éducationLa psychologie de l'éducation est, selon l'APA (American Psychological Association), la discipline qui s'intéresse au développement, à l'évaluation et à l'application : des théories de l'apprentissage et de l'enseignement ; du matériel éducatif, des programmes, des stratégies et des techniques issues de la théorie contribuant aux activités et aux processus éducatifs impliqués tout au long de la vie ; des programmes d'intervention de rééducation et correctifs auprès de différents publics.
Modèle de langageEn traitement automatique des langues, un modèle de langage ou modèle linguistique est un modèle statistique de la distribution de symboles distincts (lettres, phonèmes, mots) dans une langue naturelle. Un modèle de langage peut par exemple prédire le mot suivant dans une séquence de mots. Un modèle de langage n-gramme est un modèle de langage qui modélise des séquences de mots comme un processus de Markov. Il utilise l'hypothèse simplificatrice selon laquelle la probabilité du mot suivant dans une séquence ne dépend que d'une fenêtre de taille fixe de mots précédents.
Linguistique de corpusLa linguistique de corpus est une branche de la linguistique qui étudie le langage à travers des exemples contenus dans des textes réels. En particulier elle se propose d'extraire d'un corpus les connaissances linguistiques essentielles à l’enseignement des langues et à l'élaboration des dictionnaires. La linguistique de corpus situe la signification dans le discours et dans l'interaction entre les gens plutôt que dans l'esprit des locuteurs. En effet le sens des mots est déterminé par le contexte dans lequel ils sont employés.
Plongement lexicalLe plongement lexical (« word embedding » en anglais) est une méthode d'apprentissage d'une représentation de mots utilisée notamment en traitement automatique des langues. Le terme devrait plutôt être rendu par vectorisation de mots pour correspondre plus proprement à cette méthode. Cette technique permet de représenter chaque mot d'un dictionnaire par un vecteur de nombres réels. Cette nouvelle représentation a ceci de particulier que les mots apparaissant dans des contextes similaires possèdent des vecteurs correspondants qui sont relativement proches.
Plongée sous-marinevignette|La plongée bouteille est une autre forme de plongée loisir. Ici un plongeur en scaphandre autonome explore la Grande barrière de corail. La plongée sous-marine est une activité consistant à rester sous l'eau, soit en apnée dans le cas de la plongée libre, soit en respirant à l'aide d'un narguilé (tuyau apportant de l'air depuis la surface) ou le plus souvent en s'équipant d'une bouteille de plongée dans le cas de la plongée en scaphandre autonome.
CorpusUn corpus est un ensemble de documents, artistiques ou non (textes, s, vidéos), regroupés dans une optique précise. On peut utiliser des corpus dans plusieurs domaines : études littéraires, linguistiques, scientifiques, philosophie La branche de la linguistique qui se préoccupe plus spécifiquement des corpus s'appelle logiquement la linguistique de corpus. Elle est liée au développement des systèmes informatiques, en particulier à la constitution de bases de données textuelles.
Biais de confirmationLe biais de confirmation, également dénommé biais de , est le biais cognitif qui consiste à privilégier les informations confirmant ses idées préconçues ou ses hypothèses, ou à accorder moins de poids aux hypothèses et informations jouant en défaveur de ses conceptions, ce qui se traduit par une réticence à changer d'avis. Ce biais se manifeste chez un individu lorsqu'il rassemble des éléments ou se rappelle des informations mémorisées, de manière sélective, les interprétant d'une manière biaisée.
Traitement automatique du langage naturelLe traitement automatique du langage naturel (TALN), en anglais natural language processing ou NLP, est un domaine multidisciplinaire impliquant la linguistique, l'informatique et l'intelligence artificielle, qui vise à créer des outils de traitement du langage naturel pour diverses applications. Il ne doit pas être confondu avec la linguistique informatique, qui vise à comprendre les langues au moyen d'outils informatiques.
Technologies de l'éducationLes technologies de l'éducation (Edtech en anglais, pour Educational technology) désignent l'ensemble des nouvelles technologies permettant de faciliter l’enseignement et l'apprentissage. On parle alors de technologies pédagogiques qui permettent d'apprendre de nouveaux contenus sous une forme ludique, stimulante et innovante. Le terme Edtech, né de la contraction d'« éducation » et de « technologie », est apparu dans la littérature anglophone en 2010. Il est devenu populaire pour désigner les startups qui innovent au service de l'éducation.