Apprentissage profondL'apprentissage profond ou apprentissage en profondeur (en anglais : deep learning, deep structured learning, hierarchical learning) est un sous-domaine de l’intelligence artificielle qui utilise des réseaux neuronaux pour résoudre des tâches complexes grâce à des architectures articulées de différentes transformations non linéaires. Ces techniques ont permis des progrès importants et rapides dans les domaines de l'analyse du signal sonore ou visuel et notamment de la reconnaissance faciale, de la reconnaissance vocale, de la vision par ordinateur, du traitement automatisé du langage.
Appareil photographique hybridevignette|L'hybride Olympus OM-D E-M1. Un appareil photographique hybride (mirrorless en anglais, « sans miroir ») est un appareil photographique numérique à objectifs interchangeables dont la visée se fait par viseur numérique ou écran. Ceux-ci montrent ce que capte le capteur (contrairement aux viseurs des reflex). L’appellation mirrorless est utilisé en opposition aux reflex, sur lesquels la visée oculaire montre ce que cadre l'objectif grâce à la réflexion d'un miroir.
Profondeur de champvignette|Un diaphragme ouvert permet d'obtenir une courte profondeur de champ qui isole le sujet de son environnement. vignette|220x220px|Influence de l'ouverture sur la netteté. La profondeur de champ est un facteur déterminant la manière dont une prise de vue peut gérer la netteté relative des différents plans du sujet photographié ou observé. Elle est conçue comme une zone que l'opérateur peut augmenter ou réduire, le reste du sujet, en avant ou arrière de cette zone, perdant ou gagnant inversement en netteté.
Réseaux antagonistes génératifsEn intelligence artificielle, les réseaux antagonistes génératifs (RAG) parfois aussi appelés réseaux adverses génératifs (en anglais generative adversarial networks ou GANs) sont une classe d'algorithmes d'apprentissage non supervisé. Ces algorithmes ont été introduits par . Ils permettent de générer des images avec un fort degré de réalisme. Un GAN est un modèle génératif où deux réseaux sont placés en compétition dans un scénario de théorie des jeux. Le premier réseau est le générateur, il génère un échantillon (ex.
Time delay neural networkTime delay neural network (TDNN) is a multilayer artificial neural network architecture whose purpose is to 1) classify patterns with shift-invariance, and 2) model context at each layer of the network. Shift-invariant classification means that the classifier does not require explicit segmentation prior to classification. For the classification of a temporal pattern (such as speech), the TDNN thus avoids having to determine the beginning and end points of sounds before classifying them.
Vision par ordinateurLa vision par ordinateur est un domaine scientifique et une branche de l’intelligence artificielle qui traite de la façon dont les ordinateurs peuvent acquérir une compréhension de haut niveau à partir d's ou de vidéos numériques. Du point de vue de l'ingénierie, il cherche à comprendre et à automatiser les tâches que le système visuel humain peut effectuer. Les tâches de vision par ordinateur comprennent des procédés pour acquérir, traiter, et « comprendre » des images numériques, et extraire des données afin de produire des informations numériques ou symboliques, par ex.
Interactions homme-machinethumb|Personne plongée dans la réalité virtuelle grâce à un visiocasque et un gant électronique. thumb|L'interface homme-machine d'un des ordinateurs de bord des missions Apollo. L'interaction Homme-machine (ou interaction humain-machine), appelée IHM, s’intéresse à la conception et au développement de systèmes interactifs en prenant en compte ses impacts sociétaux et éthiques. Les humains interagissent avec les ordinateurs qui les entourent et cette interaction nécessite des interfaces qui facilitent la communication entre l'humain et la machine.
Réalité augmentéeLa réalité augmentée est la superposition de la réalité et d'éléments (sons, images 2D, 3D, vidéos) calculés par un système informatique en temps réel. Elle désigne souvent les différentes méthodes qui permettent d'incruster de façon réaliste des objets virtuels dans une séquence d'images. Elle s'applique aussi bien à la perception visuelle (superposition d'images virtuelles aux images réelles) qu'aux perceptions proprioceptives comme les perceptions tactiles ou auditives.
Réalité mixtevignette|Un exemple de réalité mixte, montrant des personnages virtuels mélangés dans un flux en direct du monde réel. La réalité mixte (RM ; en anglais : mixed reality, MR) est la fusion de mondes réels et virtuels pour produire de nouveaux environnements et visualisations, où les objets physiques et numériques coexistent et interagissent en temps réel. La réalité mixte ne se déroule pas exclusivement dans le monde physique ou virtuel, mais est un hybride de réalité et de réalité virtuelle, englobant à la fois la réalité augmentée et la virtualité augmentée par le biais de la technologie immersive.
Autofocusvignette|Principe du système de mise au point automatique. Lautofocus (AF) est le terme anglais, d'origine grecque (auto) et latine (focus), pour désigner la mise au point automatique. C'est une fonction qui permet la mise au point automatique de certains systèmes optiques comme les appareils photo, leur permettant de régler la netteté du sujet. Ce sont les premiers systèmes autofocus inventés; ils équipent aussi bien les appareils photographiques compacts que les reflex.