Reconnaissance automatique de la parolevignette|droite|upright=1.4|La reconnaissance vocale est habituellement traitée dans le middleware ; les résultats sont transmis aux applications utilisatrices. La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale) est une technique informatique qui permet d'analyser la voix humaine captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine.
Modulation par déplacement de fréquenceLa modulation par déplacement de fréquence (MDF), plus connue sous sa dénomination anglophone frequency-shift keying (FSK) est un mode de modulation de fréquence numérique dans lequel la fréquence du signal modulé varie entre des fréquences prédéterminées. Généralement, la fréquence instantanée peut prendre deux valeurs discrètes appelées mark et space. Il s'agit d'une forme non-cohérente de FSK. Dans les formes cohérentes de FSK, il n'y a pas de discontinuité de phase dans le signal de sortie.
Téléphonie large-bandeLa téléphonie large-bande se distingue de la téléphonie classique par une bande passante plus importante (50-7000 Hz) permettant d'améliorer sensiblement la qualité d'écoute. Les réseaux de téléphonie fixe et de téléphonie mobile standards permettent de transmettre la voix d'un correspondant entre 300 et 3400 Hz. La téléphonie large-bande utilise des codecs spécifiques comme le G.722, le G.722.2, le G.729.1 ou Opus Interactive Audio Codec Les services de téléphonie par internet (VoIP), par exemple Skype, utilisent la téléphonie large-bande.
Son numérique (musique)thumb|Échantillonnage (en gris) d'un signal analogique (en rouge). L'arrivée de l'informatique et du stockage d'information sous forme numérique a entraîné une véritable révolution dans le domaine musical. Cette révolution a commencé avec le CD audio, puis avec la compression des fichiers audios, puis les lecteurs dits MP3 et continue de nos jours avec l'intégration de la composante numérique dans le monde de la Hi-Fi et dans les lecteurs multimédias. Il y a pour le grand public plusieurs sources possibles pour obtenir de la musique sous forme numérique.
Processus autorégressifUn processus autorégressif est un modèle de régression pour séries temporelles dans lequel la série est expliquée par ses valeurs passées plutôt que par d'autres variables. Un processus autorégressif d'ordre p, noté AR(p) est donné par : où sont les paramètres du modèle, est une constante et un bruit blanc. En utilisant l'opérateur des retards, on peut l'écrire : Un processus autorégressif d'ordre 1 s'écrit : On peut formuler le processus AR(1) de manière récursive par rapport aux conditions précédentes : En remontant aux valeurs initiales, on aboutit à : Il est à noter que les sommes vont ici jusqu'à l'infini.
AmplitudeEn physique classique, on nomme amplitude la mesure scalaire (une coordonnée) d’un nombre positif caractérisant l’ampleur des variations d'une grandeur. Le plus souvent il s'agit de l'écart maximal par rapport à la valeur médiane (qui est aussi la valeur moyenne si la variation est symétrique). Cette définition diffère du langage courant, dans lequel l'amplitude désigne généralement l'écart entre les valeurs extrêmes d'une grandeur.
ARMAEn statistique, les modèles ARMA (modèles autorégressifs et moyenne mobile), ou aussi modèle de Box-Jenkins, sont les principaux modèles de séries temporelles. Étant donné une série temporelle , le modèle ARMA est un outil pour comprendre et prédire, éventuellement, les valeurs futures de cette série. Le modèle est composé de deux parties : une part autorégressive (AR) et une part moyenne-mobile (MA). Le modèle est généralement noté ARMA(,), où est l'ordre de la partie AR et l'ordre de la partie MA.
Traitement du sonLe traitement du son est la branche du traitement du signal qui s'applique aux signaux audio, dans le but notamment d'en améliorer la qualité, de les compresser, ou d'en extraire de l'information. Le terme analogique désigne quelque chose qui est mathématiquement représenté par une fonction continue. Donc un signal analogique est un signal représenté par un flux continu de donnée, ici dans un circuit électrique sous la forme de tension ou de courant.
Régression linéaireEn statistiques, en économétrie et en apprentissage automatique, un modèle de régression linéaire est un modèle de régression qui cherche à établir une relation linéaire entre une variable, dite expliquée, et une ou plusieurs variables, dites explicatives. On parle aussi de modèle linéaire ou de modèle de régression linéaire. Parmi les modèles de régression linéaire, le plus simple est l'ajustement affine. Celui-ci consiste à rechercher la droite permettant d'expliquer le comportement d'une variable statistique y comme étant une fonction affine d'une autre variable statistique x.
Digital Audio Broadcastingvignette|Un récepteur radio compatible DAB. Le DAB pour Digital Audio Broadcasting, ou en français radiodiffusion numérique ou système de radiodiffusion sonore numérique, est un système de radiodiffusion numérique développé et standardisé au départ par le projet européen , et actuellement exploité sur plusieurs continents. Depuis 2007 est déployée une version améliorée du standard, appelée « DAB+ ». Les premières émissions régulières en DAB ont eu lieu en 1995 : chaîne NRK Klassisk de la Société norvégienne de radiodiffusion (NRK) lancée le , chaînes de la BBC et de la radio suédoise (SR) lancées le .