Reconnaissance de l'écriture manuscriteLa reconnaissance de l’écriture manuscrite (en anglais, handwritten text recognition ou HTR) est un traitement informatique qui a pour but de traduire un texte écrit en un texte codé numériquement. Il faut distinguer deux reconnaissances distinctes, avec des problématiques et des solutions différentes : la reconnaissance en-ligne ; la reconnaissance hors-ligne. La reconnaissance de l’écriture manuscrite fait appel à la reconnaissance de forme, mais également au traitement automatique du langage naturel.
Reconnaissance optique de caractèresvignette|Vidéo montrant un processus de reconnaissance optique de caractères effectué en direct grâce à un scanner portable. La reconnaissance optique de caractères (ROC, ou OCR pour l'anglais optical character recognition), ou océrisation, désigne les procédés informatiques pour la traduction d'images de textes imprimés ou dactylographiés en fichiers de texte. Un ordinateur réclame pour l'exécution de cette tâche un logiciel d'OCR.
Paléographievignette|Exemple de texte en latin, dont la première phrase est : . La paléographie (du grec ancien / palaiόs (« ancien »), et / graphía (« écriture ») est l'étude des écritures manuscrites anciennes, indépendamment de la langue utilisée (grec ancien, latin classique, latin médiéval, occitan médiéval, ancien français, moyen français, français classique, anciens caractères chinois, arabe, notation musicale, etc.).
Modèle de langageEn traitement automatique des langues, un modèle de langage ou modèle linguistique est un modèle statistique de la distribution de symboles distincts (lettres, phonèmes, mots) dans une langue naturelle. Un modèle de langage peut par exemple prédire le mot suivant dans une séquence de mots. Un modèle de langage n-gramme est un modèle de langage qui modélise des séquences de mots comme un processus de Markov. Il utilise l'hypothèse simplificatrice selon laquelle la probabilité du mot suivant dans une séquence ne dépend que d'une fenêtre de taille fixe de mots précédents.
A priori et a posterioriA priori (ou à priori selon l'orthographe rectifiée de 1990) et a posteriori (ou à postériori) sont un couple de concepts utilisés en philosophie et notamment en philosophie de la connaissance. Une connaissance est a priori lorsqu'elle est indépendante de l'expérience sensible et logiquement antérieure. Emmanuel Kant soutient qu'il s'agit d'une connaissance « indépendante de l'expérience ». A contrario, une connaissance a posteriori est empirique, c'est-à-dire qu'elle est « issu[e] de l'expérience » (Kant).
Reconnaissance automatique de la parolevignette|droite|upright=1.4|La reconnaissance vocale est habituellement traitée dans le middleware ; les résultats sont transmis aux applications utilisatrices. La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale) est une technique informatique qui permet d'analyser la voix humaine captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine.
Reconnaissance de formesthumb|Reconnaissance de forme à partir de modélisation en 3D La reconnaissance de formes (ou parfois reconnaissance de motifs) est un ensemble de techniques et méthodes visant à identifier des régularités informatiques à partir de données brutes afin de prendre une décision dépendant de la catégorie attribuée à ce motif. On considère que c'est une branche de l'intelligence artificielle qui fait largement appel aux techniques d'apprentissage automatique et aux statistiques.
ConnaissanceLa connaissance est une notion aux sens multiples, à la fois utilisée dans le langage courant et objet d'étude poussée de la part des sciences cognitives et des philosophes contemporains. Les connaissances, leur nature et leur variété, la façon dont elles sont acquises, leur processus d'acquisition, leur valeur et leur rôle dans les sociétés humaines, sont étudiés par une diversité de disciplines, notamment la philosophie, l'épistémologie, la psychologie, les sciences cognitives, l'anthropologie et la sociologie.
Traitement automatique du langage naturelLe traitement automatique du langage naturel (TALN), en anglais natural language processing ou NLP, est un domaine multidisciplinaire impliquant la linguistique, l'informatique et l'intelligence artificielle, qui vise à créer des outils de traitement du langage naturel pour diverses applications. Il ne doit pas être confondu avec la linguistique informatique, qui vise à comprendre les langues au moyen d'outils informatiques.
Manuscritthumb|Manuscrit médiéval en latin de la Physique d'Aristote. Un manuscrit (du latin manu scriptus) est, littéralement, un texte « écrit à la main », sur un support souple, que ce soit par son auteur (« manuscrit autographe ») ou par un copiste, avant l'invention de l'imprimerie. Le terme s'applique à différents supports (papyrus, parchemin ou papier) mais ne s'emploie pas pour des supports rigides, comme les tablettes de cire ou les inscriptions épigraphiques ou rupestres.