Text-to-image modelA text-to-image model is a machine learning model which takes an input natural language description and produces an image matching that description. Such models began to be developed in the mid-2010s, as a result of advances in deep neural networks. In 2022, the output of state of the art text-to-image models, such as OpenAI's DALL-E 2, Google Brain's , StabilityAI's Stable Diffusion, and Midjourney began to approach the quality of real photographs and human-drawn art.
Scanner (informatique)Un scanner, ou scanneur, aussi appelé numériseur à balayage, est un périphérique informatique qui permet de numériser des documents ou autres, comme les empreintes digitales par exemple. Un scanner analyse le document en mesurant sa réflectance élément de surface par élément de surface. Les éléments reçoivent, simultanément ou séquenciellement, un rayon lumineux ; un ou plusieurs capteurs transforment la lumière réfléchie en un signal électrique qui est numérisé, constituant ainsi une transférée à l'ordinateur, pour y être ensuite sauvegardé, traité ou analysé.
SuperlentilleUne superlentille est une lentille optique élaborée avec des métamatériaux et permettant de distinguer des détails jusqu'à vingt fois inférieurs à la longueur d'onde d'utilisation. Une lentille classique est dite « limitée par la diffraction », c'est-à-dire que l'image la plus petite que l'on pourra obtenir sera toujours une tache d'Airy et donc possède un diamètre dépendant du diamètre de la lentille et de la longueur d'onde d'utilisation, limitant l'utilisation de lentilles classiques en verre optique à l'observation d'objet de quelques centaines de nanomètres.
Visualisation de donnéesvignette|upright=2|Carte figurative des pertes successives en hommes de l'armée française dans la campagne de Russie 1812-1813, par Charles Minard, 1869. La visualisation des données (ou dataviz ou représentation graphique de données) est un ensemble de méthodes permettant de résumer de manière graphique des données statistiques qualitatives et surtout quantitatives afin de montrer les liens entre des ensembles de ces données. Cette fait partie de la science des données.
Réseau sémantiqueUn réseau sémantique est un graphe marqué destiné à la représentation des connaissances, qui représente des relations sémantiques entre concepts. Le graphe est orienté ou non orienté. Ses sommets représentent les concepts, et les liens entre les sommets (nœuds) représentent les relations sémantiques, reliant les champs lexicaux. Un réseau sémantique peut être instancié, par exemple,dans une base de données orientée graphes ou un schéma conceptuel. Les réseaux sémantiques normalisés sont exprimés sous forme de triplets RDF.
Redimensionnement d'imageLe redimensionnement, ou la mise à l'échelle, est une transformation applicable à une qui consiste à en modifier la taille, que ce soit pour l'agrandir ou pour la rétrécir, comme le ferait un zoom. Le redimensionnement existe aussi bien pour les , où il n'implique aucune perte de qualité, que pour les , où il est moins trivial et entraîne des effets indésirables et une perte de qualité. La méthode la plus simple pour réduire la résolution d'une image est de la sous-échantillonner.
Méthode d'OtsuEn vision par ordinateur et , la méthode d'Otsu est utilisée pour effectuer un automatique à partir de la forme de l', ou la réduction d'une image à niveaux de gris en une image binaire. L'algorithme suppose alors que l'image à binariser ne contient que deux classes de pixels, (c'est-à-dire le premier plan et l'arrière-plan) puis calcule le seuil optimal qui sépare ces deux classes afin que leur variance intra-classe soit minimale. L'extension de la méthode originale pour faire du seuillage à plusieurs niveaux est appelée Multi Otsu method.
Semantic integrationSemantic integration is the process of interrelating information from diverse sources, for example calendars and to do lists, email archives, presence information (physical, psychological, and social), documents of all sorts, contacts (including social graphs), search results, and advertising and marketing relevance derived from them. In this regard, semantics focuses on the organization of and action upon information by acting as an intermediary between heterogeneous data sources, which may conflict not only by structure but also context or value.
Google DeepMindGoogle DeepMind est une entreprise spécialisée dans l'intelligence artificielle appartenant à Google. L'entreprise est remarquée notamment pour son programme de jeu de Go AlphaGo, et son logiciel AlphaFold, qui permet de prédire la structure des protéines à partir de leurs séquences en acides aminés. Originellement appelée DeepMind Technologies Limited et fondée en 2010 par Demis Hassabis, Mustafa Suleyman et Shane Legg, elle est rachetée le 26 janvier 2014, par Google pour plus de 628 millions de dollars américains.
Graph cuts in computer visionAs applied in the field of computer vision, graph cut optimization can be employed to efficiently solve a wide variety of low-level computer vision problems (early vision), such as , the stereo correspondence problem, , object co-segmentation, and many other computer vision problems that can be formulated in terms of energy minimization. Many of these energy minimization problems can be approximated by solving a maximum flow problem in a graph (and thus, by the max-flow min-cut theorem, define a minimal cut of the graph).