Emotion recognitionEmotion recognition is the process of identifying human emotion. People vary widely in their accuracy at recognizing the emotions of others. Use of technology to help people with emotion recognition is a relatively nascent research area. Generally, the technology works best if it uses multiple modalities in context. To date, the most work has been conducted on automating the recognition of facial expressions from video, spoken expressions from audio, written expressions from text, and physiology as measured by wearables.
Speaker recognitionSpeaker recognition is the identification of a person from characteristics of voices. It is used to answer the question "Who is speaking?" The term voice recognition can refer to speaker recognition or speech recognition. Speaker verification (also called speaker authentication) contrasts with identification, and speaker recognition differs from speaker diarisation (recognizing when the same speaker is speaking).
Rôle de genrevignette|Symboles de genre utilisés pour désigner les femmes (à gauche) ou les hommes (à droite) La notion de rôle de genre désigne le fait qu'il existe des attentes sociales particulières envers les individus en fonction de leur genre. Divers facteurs sont à l'origine du développement des rôles de genre, et ils ont une influence sur la vie des individus à différents niveaux. Par ailleurs, les rôles de genre diffèrent selon les cultures et les époques.
Reconnaissance de formesthumb|Reconnaissance de forme à partir de modélisation en 3D La reconnaissance de formes (ou parfois reconnaissance de motifs) est un ensemble de techniques et méthodes visant à identifier des régularités informatiques à partir de données brutes afin de prendre une décision dépendant de la catégorie attribuée à ce motif. On considère que c'est une branche de l'intelligence artificielle qui fait largement appel aux techniques d'apprentissage automatique et aux statistiques.
Sound recording and reproductionSound recording and reproduction is the electrical, mechanical, electronic, or digital inscription and re-creation of sound waves, such as spoken voice, singing, instrumental music, or sound effects. The two main classes of sound recording technology are analog recording and digital recording. Sound recording is the transcription of invisible vibrations in air onto a storage medium such as a phonograph disc. The process is reversed in sound reproduction, and the variations stored on the medium are transformed back into sound waves.
Ingénieur du sonLe terme ingénieur du son est un terme générique qui peut s'appliquer à des métiers différents, avec des qualifications spécifiques. L'ingénieur du son a pour fonction d'assurer la gestion du son dans différents secteurs d'activité : cinéma (nommé généralement chef-opérateur du son) ; musique ; radio ; télévision ; sonorisation (concerts) ; spectacle vivant ; jeu vidéo. Un ingénieur du son conçoit, fabrique et opère les outils de captation et d'enregistrement pour enregistrer et mixer des programmes sonores aux moyens de machines réelles et virtuelles.
Champ aléatoire conditionnelLes champs aléatoires conditionnels (conditional random fields ou CRFs) sont une classe de modèles statistiques utilisés en reconnaissance des formes et plus généralement en apprentissage statistique. Les CRFs permettent de prendre en compte l'interaction de variables « voisines ». Ils sont souvent utilisés pour des données séquentielles (langage naturel, séquences biologiques, vision par ordinateur). Les CRFs sont un exemple de réseau probabiliste non orienté.
Haut-parleurvignette|Un haut-parleur électrodynamique. vignette|Schéma de coupe d'un haut-parleur électrodynamique. Un haut-parleur, ou hautparleur, est un transducteur électroacoustique destiné à produire des sons à partir d'un signal électrique. Il est en cela l'inverse du microphone. Par extension, on emploie parfois ce terme pour désigner un appareil complet destiné à la reproduction sonore (voir Enceinte). Quatre types de haut-parleurs, électrodynamique, électrostatique, piézoélectrique et isodynamique, représentent les technologies actuelles les plus courantes.
Enregistrement multipisteL'enregistrement multipiste est une méthode d'enregistrement sonore qui permet l'enregistrement et le réenregistrement de plusieurs sources sonores, simultanément ou successivement. Ce procédé permet notamment d'enregistrer plusieurs musiciens (ou groupes de musiciens) séparément, puis un chanteur, et de corriger ou d'améliorer, grâce à de nouvelles prises, l'interprétation des uns ou des autres, sans avoir à reprendre l'ensemble. En audiovisuel, les pistes servent au dialogue, aux bruits d'ambiance, à la musique.
Reconnaissance automatique de la parolevignette|droite|upright=1.4|La reconnaissance vocale est habituellement traitée dans le middleware ; les résultats sont transmis aux applications utilisatrices. La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale) est une technique informatique qui permet d'analyser la voix humaine captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine.