Reconnaissance automatique de la parolevignette|droite|upright=1.4|La reconnaissance vocale est habituellement traitée dans le middleware ; les résultats sont transmis aux applications utilisatrices. La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale) est une technique informatique qui permet d'analyser la voix humaine captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine.
Assistant personnel intelligentvignette|redresse|La Google Home, l'enceinte connectée de la firme Google. Un assistant personnel intelligent, aussi appelé assistant personnel virtuel (en anglais, intelligent personal assistant ou virtual assistant) est un agent logiciel qui peut effectuer des tâches ou des services pour un individu. Parfois, le terme « dialogueur » est utilisé pour faire référence aux assistants virtuels en général ou spécifiquement ceux accessibles par dialogue en ligne (ou dans quelques cas les programmes de dialogue en ligne qui sont pour le divertissement et qui n’ont pas de buts utiles).
Cortana (assistant personnel intelligent)Cortana est le nom de l'assistant personnel intelligent développé par Microsoft pour sa plateforme Windows Phone à partir de la version 8.1 et désormais sur Windows 10. Cortana existe également sur Android et iOS (en bêta et uniquement dans certaines langues) sous la forme d'une application et est intégré avec le système CyanogenMod. Cependant, Microsoft ne voit plus Cortana comme une concurrente directe des assistants Alice de Yandex, Siri d'Apple, Bixby de Samsung, et Google Assistant.
Traitement de la paroleLe traitement de la parole est une discipline technologique dont l'objectif est la captation, la transmission, l'identification et la synthèse de la parole. Dans ce domaine, on peut définir la parole comme un texte oral. On s'intéresse à l'intelligibilité, c'est-à-dire à la possibilité, pour la personne qui écoute, de comprendre sans erreur le texte émis ; à l'amélioration de l'intelligibilité quand le signal est dégradé ; à l'identification de la personne qui parle ; à l'établissement automatique d'un texte écrit à partir de la parole ; à la synthèse de la parole à partir d'un texte écrit.
Assistant GoogleL'Assistant Google est un service en ligne de type assistant personnel intelligent. Sa principale innovation tient au fait qu'il permet une interface utilisateur vocale fonctionnant grâce à l'intelligence artificielle, il est disponible principalement sur les appareils mobiles et les accessoires de maison connectée. Contrairement à son prédécesseur, Google Now, l'Assistant Google peut échanger avec son interlocuteur.
Synthèse vocaleLa synthèse vocale est une technique informatique de synthèse sonore qui permet de créer de la parole artificielle à partir de n'importe quel texte. Pour obtenir ce résultat, elle s'appuie à la fois sur des techniques de traitement linguistique, notamment pour transformer le texte orthographique en une version phonétique prononçable sans ambiguïté, et sur des techniques de traitement du signal pour transformer cette version phonétique en son numérisé écoutable sur un haut parleur.
Emotion recognitionEmotion recognition is the process of identifying human emotion. People vary widely in their accuracy at recognizing the emotions of others. Use of technology to help people with emotion recognition is a relatively nascent research area. Generally, the technology works best if it uses multiple modalities in context. To date, the most work has been conducted on automating the recognition of facial expressions from video, spoken expressions from audio, written expressions from text, and physiology as measured by wearables.
Contrôle de la circulation aérienneLe service de contrôle de la circulation aérienne (ATC — de l'anglais Air Traffic Control ), communément appelé contrôle aérien, est un service rendu par des contrôleurs aériens aux aéronefs afin d'aider à l'exécution sûre, rapide et efficace des vols. Il est l'un des trois services de la circulation aérienne prévus par la Convention de Chicago afin d'assurer la sécurité du transport aérien mondial, aux côtés de l'information de vol et de l'alerte.
Apprentissage automatiqueL'apprentissage automatique (en anglais : machine learning, « apprentissage machine »), apprentissage artificiel ou apprentissage statistique est un champ d'étude de l'intelligence artificielle qui se fonde sur des approches mathématiques et statistiques pour donner aux ordinateurs la capacité d'« apprendre » à partir de données, c'est-à-dire d'améliorer leurs performances à résoudre des tâches sans être explicitement programmés pour chacune. Plus largement, il concerne la conception, l'analyse, l'optimisation, le développement et l'implémentation de telles méthodes.
Interface utilisateur vocaleUne interface utilisateur vocale ou IUV (ou VUI pour Vocal User Interface en anglais) rend possible l'interaction orale entre les humains et les ordinateurs. Un dispositif de commande vocale (ou VCD pour Voice Command Device) est un appareil doté d'une interface utilisateur vocale. Les ordinateurs équipés d'un tel dispositif utilisent généralement la reconnaissance vocale pour comprendre les mots énoncés par les humains et la synthèse vocale pour en produire.