Object co-segmentationIn computer vision, object co-segmentation is a special case of , which is defined as jointly segmenting semantically similar objects in multiple images or video frames. It is often challenging to extract segmentation masks of a target/object from a noisy collection of images or video frames, which involves object discovery coupled with . A noisy collection implies that the object/target is present sporadically in a set of images or the object/target disappears intermittently throughout the video of interest.
Visual cultureVisual culture is the aspect of culture expressed in . Many academic fields study this subject, including cultural studies, art history, critical theory, philosophy, media studies, Deaf Studies, and anthropology. The field of visual culture studies in the United States corresponds or parallels the Bildwissenschaft ("image studies") in Germany. Both fields are not entirely new, as they can be considered reformulations of issues of photography and film theory that had been raised from the 1920s and 1930s by authors like Béla Balázs, László Moholy-Nagy, Siegfried Kracauer and Walter Benjamin.
Reconnaissance optique de caractèresvignette|Vidéo montrant un processus de reconnaissance optique de caractères effectué en direct grâce à un scanner portable. La reconnaissance optique de caractères (ROC, ou OCR pour l'anglais optical character recognition), ou océrisation, désigne les procédés informatiques pour la traduction d'images de textes imprimés ou dactylographiés en fichiers de texte. Un ordinateur réclame pour l'exécution de cette tâche un logiciel d'OCR.
Acuité visuellevignette|Tableau de Snellen qui permet de mesurer l'acuité visuelle humaine. L'acuité visuelle (mesurée sur un œil, en vision de loin) est la capacité de discerner un petit objet (ou optotype) situé le plus loin possible, ce qui est équivalent à voir à une distance fixe (en général cinq mètres) un optotype sous le plus petit angle possible. Le minimum visible représente la visibilité binaire d'un point ou d'une ligne (vu/non vu). Un trait ou un point de fort contraste, typiquement un trait noir sur un fond blanc, peut être distingué à partir d’un diamètre apparent de 0,5 seconde d’arc.
Multimodal sentiment analysisMultimodal sentiment analysis is a technology for traditional text-based sentiment analysis, which includes modalities such as audio and visual data. It can be bimodal, which includes different combinations of two modalities, or trimodal, which incorporates three modalities. With the extensive amount of social media data available online in different forms such as videos and images, the conventional text-based sentiment analysis has evolved into more complex models of multimodal sentiment analysis, which can be applied in the development of virtual assistants, analysis of YouTube movie reviews, analysis of news videos, and emotion recognition (sometimes known as emotion detection) such as depression monitoring, among others.
Information extractionInformation extraction (IE) is the task of automatically extracting structured information from unstructured and/or semi-structured machine-readable documents and other electronically represented sources. In most of the cases this activity concerns processing human language texts by means of natural language processing (NLP). Recent activities in multimedia document processing like automatic annotation and content extraction out of images/audio/video/documents could be seen as information extraction Due to the difficulty of the problem, current approaches to IE (as of 2010) focus on narrowly restricted domains.
Active-pixel sensorAn active-pixel sensor (APS) is an , which was invented by Peter J.W. Noble in 1968, where each pixel sensor unit cell has a photodetector (typically a pinned photodiode) and one or more active transistors. In a metal–oxide–semiconductor (MOS) active-pixel sensor, MOS field-effect transistors (MOSFETs) are used as amplifiers. There are different types of APS, including the early NMOS APS and the now much more common complementary MOS (CMOS) APS, also known as the CMOS sensor.
Synchronie et diachronieLa synchronie et la diachronie sont deux dimensions d’un même objet d’étude. La première est son état à un moment donné du temps, tandis que la seconde intègre les évolutions de son état dans le temps. Cette distinction née en linguistique a aussi été appliquée à d’autres domaines, comme la critique textuelle, la géopolitique, la philosophie, la sociologie ou la psychanalyse.
Traitement automatique du langage naturelLe traitement automatique du langage naturel (TALN), en anglais natural language processing ou NLP, est un domaine multidisciplinaire impliquant la linguistique, l'informatique et l'intelligence artificielle, qui vise à créer des outils de traitement du langage naturel pour diverses applications. Il ne doit pas être confondu avec la linguistique informatique, qui vise à comprendre les langues au moyen d'outils informatiques.
Analyse prédictiveL'analyse (ou logique) prédictive englobe une variété de techniques issues des statistiques, d'extraction de connaissances à partir de données et de la théorie des jeux qui analysent des faits présents et passés pour faire des hypothèses prédictives sur des événements futurs. Dans le monde des affaires, des modèles prédictifs exploitent des schémas découverts à l'intérieur des ensembles de données historiques et transactionnelles pour identifier les risques et les opportunités.