Résumé
ImageNet est une base de données d'images annotées produit par l'organisation du même nom, à destination des travaux de recherche en vision par ordinateur. En 2016, plus de dix millions d'URLs ont été annotées à la main pour indiquer quels objets sont représentés dans l'image ; plus d'un million d'images bénéficient en plus de boîtes englobantes autour des objets. La base de données d'annotations sur des URL d'images tierces est disponible librement, ImageNet ne possédant cependant pas les images elles-mêmes. De 2010 à 2017, le projet ImageNet a organisé un concours annuel : ImageNet Large Scale Visual Recognition Challenge (ILSVRC), ou "Compétition ImageNet de Reconnaissance Visuelle à Grande Échelle". Elle consistait en une compétition logicielle dont le but était de détecter et classifier précisément des objets et des scènes dans les images naturelles. La chercheuse Fei-Fei Li a commencé a travailler sur l'idée du dataset ImageNet en 2006. À une époque où les chercheurs se focalisent sur les modèles et les algorithmes, Li décide d'augmenter et d'améliorer les données disponibles pour entraîner les algorithmes d'apprentissage artificiel. En 2007, Fei-Fei Li rencontre Christiane Fellbaum, professeure à l'Université de Princeton et une des créatrices de WordNet pour discuter du projet. À la suite de cette rencontre, Li construit ImageNet à partir de WordNet, en ré-utilisant plusieurs de ses caractéristiques. La base de données ImageNet a été présentée pour la première fois lors des sessions de présentation de posters en 2009 à la Conférence sur la Vision par Ordinateur et Reconnaissance de formes (CVPR) en Floride, par des chercheurs du département d'Informatique à l'Université de Princeton. ImageNet utilise la production participative dans son processus d'annotation. L'annotation à l'échelle de l'image indique la présence ou l'absence d'une classe d'objet dans celle-ci, par exemple « il y a des tigres dans cette image » ou « il n'y a pas de tigres dans cette image ».
À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
Concepts associés (1)
Apprentissage profond
L'apprentissage profond ou apprentissage en profondeur (en anglais : deep learning, deep structured learning, hierarchical learning) est un sous-domaine de l’intelligence artificielle qui utilise des réseaux neuronaux pour résoudre des tâches complexes grâce à des architectures articulées de différentes transformations non linéaires. Ces techniques ont permis des progrès importants et rapides dans les domaines de l'analyse du signal sonore ou visuel et notamment de la reconnaissance faciale, de la reconnaissance vocale, de la vision par ordinateur, du traitement automatisé du langage.