HAL 9000HAL 9000 (traduit en CARL 500 en version française) est un personnage de fiction, un supercalculateur doté d'intelligence artificielle. Il a été conçu pour gérer de manière autonome les fonctions vitales du vaisseau spatial Discovery One, en mission dans l'espace vers la planète Jupiter. Le personnage apparaît dans la saga des Odyssées de l'espace du romancier de science-fiction britannique Arthur C. Clarke, dont les deux premiers romans ont été adaptés au cinéma ; d'abord dans le film 2001, l'Odyssée de l'espace (1968) de Stanley Kubrick, puis dans 2010 : L'Année du premier contact (1984) de Peter Hyams.
LinguistiqueLa linguistique est une discipline scientifique s’intéressant à l’étude du langage. Elle n'est pas prescriptive mais descriptive. La prescription correspond à la norme, c'est-à-dire ce qui est jugé correct linguistiquement par les grammairiens. À l'inverse, la linguistique se contente de décrire la langue telle qu'elle est et non telle qu'elle devrait être. On trouve des témoignages de réflexions sur le langage dès l'Antiquité avec des philosophes comme Platon.
Vocodeurvignette|Un Vocoder VC-10 de Korg. Le vocoder ou vocodeur est un dispositif électronique de traitement du signal sonore. Son nom, contraction de voice coder (« codeur de voix » en anglais), a été francisé en « vocodeur ». Il analyse les principales composantes spectrales de la voix (ou d'un autre son) et fabrique un son synthétique à partir du résultat de cette analyse. Le vocodeur a été inventé en 1939 par Homer Dudley, ingénieur aux laboratoires Bell, afin d'assurer une transmission efficace de la voix sur le réseau téléphonique.
Linear predictive codingLinear predictive coding (LPC) is a method used mostly in audio signal processing and speech processing for representing the spectral envelope of a digital signal of speech in compressed form, using the information of a linear predictive model. LPC is the most widely used method in speech coding and speech synthesis. It is a powerful speech analysis technique, and a useful method for encoding good quality speech at a low bit rate.
Traitement de la paroleLe traitement de la parole est une discipline technologique dont l'objectif est la captation, la transmission, l'identification et la synthèse de la parole. Dans ce domaine, on peut définir la parole comme un texte oral. On s'intéresse à l'intelligibilité, c'est-à-dire à la possibilité, pour la personne qui écoute, de comprendre sans erreur le texte émis ; à l'amélioration de l'intelligibilité quand le signal est dégradé ; à l'identification de la personne qui parle ; à l'établissement automatique d'un texte écrit à partir de la parole ; à la synthèse de la parole à partir d'un texte écrit.
Apprentissage profondL'apprentissage profond ou apprentissage en profondeur (en anglais : deep learning, deep structured learning, hierarchical learning) est un sous-domaine de l’intelligence artificielle qui utilise des réseaux neuronaux pour résoudre des tâches complexes grâce à des architectures articulées de différentes transformations non linéaires. Ces techniques ont permis des progrès importants et rapides dans les domaines de l'analyse du signal sonore ou visuel et notamment de la reconnaissance faciale, de la reconnaissance vocale, de la vision par ordinateur, du traitement automatisé du langage.
Traitement du sonLe traitement du son est la branche du traitement du signal qui s'applique aux signaux audio, dans le but notamment d'en améliorer la qualité, de les compresser, ou d'en extraire de l'information. Le terme analogique désigne quelque chose qui est mathématiquement représenté par une fonction continue. Donc un signal analogique est un signal représenté par un flux continu de donnée, ici dans un circuit électrique sous la forme de tension ou de courant.
Reconnaissance automatique de la parolevignette|droite|upright=1.4|La reconnaissance vocale est habituellement traitée dans le middleware ; les résultats sont transmis aux applications utilisatrices. La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale) est une technique informatique qui permet d'analyser la voix humaine captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine.
ParoleLa parole est le langage articulé humain (même si des études ethologiques et philosophiques sont en cours pour déterminer si d’autres animaux pourraient être considérés comme dotés de parole, notamment les perroquets) destiné à communiquer la pensée, et est à distinguer des communications orales diverses, comme les cris, les alertes ou les gémissements. « Articuler la parole » consiste à former des signes audibles, les syllabes, formant les mots qui constituent des symboles.
FormantOn désigne par formant l'un des maxima d'énergie du spectre sonore d'un son de parole. Ce terme est notamment employé dans le domaine de la linguistique, de la phonétique et de l'acoustique. Il y a plusieurs définitions du mot « formant » (résonances du conduit vocal, pôles). vignette|Spectrogramme des voyelles [i, u, ɑ] en anglais américain, montrant les formants F1 et F2. Les formants peuvent être visualisés sur des spectres sonores. Ces spectres représentent la distribution en fréquences de l'énergie du signal de parole.