Reconnaissance optique de caractèresvignette|Vidéo montrant un processus de reconnaissance optique de caractères effectué en direct grâce à un scanner portable. La reconnaissance optique de caractères (ROC, ou OCR pour l'anglais optical character recognition), ou océrisation, désigne les procédés informatiques pour la traduction d'images de textes imprimés ou dactylographiés en fichiers de texte. Un ordinateur réclame pour l'exécution de cette tâche un logiciel d'OCR.
Reconnaissance de l'écriture manuscriteLa reconnaissance de l’écriture manuscrite (en anglais, handwritten text recognition ou HTR) est un traitement informatique qui a pour but de traduire un texte écrit en un texte codé numériquement. Il faut distinguer deux reconnaissances distinctes, avec des problématiques et des solutions différentes : la reconnaissance en-ligne ; la reconnaissance hors-ligne. La reconnaissance de l’écriture manuscrite fait appel à la reconnaissance de forme, mais également au traitement automatique du langage naturel.
Caractères chinoisLes caractères chinois, ou sinogrammes, sont les unités logographiques qui composent l'écriture des langues chinoises. Ils sont appelés en chinois hànzì (« caractères han »), s'écrivant, en , et depuis le en République populaire de Chine, en Malaisie et à Singapour, en . Ils ont été dans le passé ou sont également de nos jours utilisés pour écrire d'autres langues, à titre principal ou complémentaire, notamment le coréen (hanja), le japonais (kanji) ou le vietnamien (chữ nho).
Reconnaissance de formesthumb|Reconnaissance de forme à partir de modélisation en 3D La reconnaissance de formes (ou parfois reconnaissance de motifs) est un ensemble de techniques et méthodes visant à identifier des régularités informatiques à partir de données brutes afin de prendre une décision dépendant de la catégorie attribuée à ce motif. On considère que c'est une branche de l'intelligence artificielle qui fait largement appel aux techniques d'apprentissage automatique et aux statistiques.
Écriture manuscritevignette|Fac-similé d’une lettre manuscrite d’Eugène Delacroix à Ingres (1851). L’écriture manuscrite est l'acte d'écrire avec la main, de réaliser un manuscrit. On parle plus rarement de manuscriture, terme signifiant littéralement « écriture manuscrite » mais qui n’est cependant pas employé dans ce sens général. C’est un néologisme savant pour différencier de l’écriture au sens actuel, qui sous-entend « une visée ou présupposition d’un passage à l’imprimé », l’écriture de textes médiévaux comprise comme une notation par un tiers sachant écrire, de propos essentiellement oraux, autrement dit dissociant l’« auteur » et le « scripteur ».
Étymologie des caractères chinoisL’étymologie des caractères chinois décrit l'origine des signes employés par l'écriture chinoise, c'est-à-dire la manière dont ils ont été composés ou dérivés, en relation avec leur sémantique originelle. Tous les caractères chinois sont des logogrammes, mais on peut en distinguer plusieurs types, suivant leur étymologie. Un petit nombre sont des pictogrammes ( pinyin : xiàngxíng) ; un plus grand nombre sont des idéogrammes au sens strict ( zhǐshì), généralement composés ( huìyì) ; mais une écrasante majorité sont des composés nommés idéophonogrammes ( xíngshēng).
Reconnaissance automatique de la parolevignette|droite|upright=1.4|La reconnaissance vocale est habituellement traitée dans le middleware ; les résultats sont transmis aux applications utilisatrices. La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale) est une technique informatique qui permet d'analyser la voix humaine captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine.
Alphabet glagolitiqueL'alphabet glagolitique (ou glagolitsa, en russe, bulgare et macédonien : глаголица ; en глагољица ; en glagoljica ; en глаголиця, hlaholytsia) est le plus ancien alphabet slave. Inventé par les frères Cyrille et Méthode au , il est originellement utilisé en Grande-Moravie. Il tire son nom du vieux-slave glagoljati qui signifie « dire ». Il est couramment utilisé au Moyen Âge dans les pays de langues slaves méridionales, et sporadiquement au royaume de Bohême.
Camel casevignette|CamelCase illustré avec un chameau. vignette|camelCase illustré avec un dromadaire. vignette|Camel case sur un panneau de direction (les mots champions et gate sont mis bout-à-bout et le second commence par une majuscule pour marquer la séparation). Le camel case (de l'anglais, littéralement « casse de chameau ») est une notation consistant à écrire un ensemble de mots en les liant sans espace ni ponctuation, et en mettant en capitale la première lettre de chaque mot.
Classement automatiquevignette|La fonction 1-x^2-2exp(-100x^2) (rouge) et les valeurs déplacées par un bruit de 0,1*N(0,1). Le classement automatique ou classification supervisée est la catégorisation algorithmique d'objets. Elle consiste à attribuer une classe ou catégorie à chaque objet (ou individu) à classer, en se fondant sur des données statistiques. Elle fait couramment appel à l'apprentissage automatique et est largement utilisée en reconnaissance de formes. En français, le classement fait référence à l'action de classer donc de « ranger dans une classe ».