ImageNet est une base de données d'images annotées produit par l'organisation du même nom, à destination des travaux de recherche en vision par ordinateur. En 2016, plus de dix millions d'URLs ont été annotées à la main pour indiquer quels objets sont représentés dans l'image ; plus d'un million d'images bénéficient en plus de boîtes englobantes autour des objets. La base de données d'annotations sur des URL d'images tierces est disponible librement, ImageNet ne possédant cependant pas les images elles-mêmes. De 2010 à 2017, le projet ImageNet a organisé un concours annuel : ImageNet Large Scale Visual Recognition Challenge (ILSVRC), ou "Compétition ImageNet de Reconnaissance Visuelle à Grande Échelle". Elle consistait en une compétition logicielle dont le but était de détecter et classifier précisément des objets et des scènes dans les images naturelles. La chercheuse Fei-Fei Li a commencé a travailler sur l'idée du dataset ImageNet en 2006. À une époque où les chercheurs se focalisent sur les modèles et les algorithmes, Li décide d'augmenter et d'améliorer les données disponibles pour entraîner les algorithmes d'apprentissage artificiel. En 2007, Fei-Fei Li rencontre Christiane Fellbaum, professeure à l'Université de Princeton et une des créatrices de WordNet pour discuter du projet. À la suite de cette rencontre, Li construit ImageNet à partir de WordNet, en ré-utilisant plusieurs de ses caractéristiques. La base de données ImageNet a été présentée pour la première fois lors des sessions de présentation de posters en 2009 à la Conférence sur la Vision par Ordinateur et Reconnaissance de formes (CVPR) en Floride, par des chercheurs du département d'Informatique à l'Université de Princeton. ImageNet utilise la production participative dans son processus d'annotation. L'annotation à l'échelle de l'image indique la présence ou l'absence d'une classe d'objet dans celle-ci, par exemple « il y a des tigres dans cette image » ou « il n'y a pas de tigres dans cette image ».

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
Cours associés (5)
CS-625: Transfer learning and meta-learning
This seminar course covers principles and recent advancements in machine learning methods that have the ability to solve multiple tasks and generalize to new domains in which training and test distrib
PHYS-467: Machine learning for physicists
Machine learning and data analysis are becoming increasingly central in sciences including physics. In this course, fundamental principles and methods of machine learning will be introduced and practi
CIVIL-459: Deep learning for autonomous vehicles
Deep Learning (DL) is the subset of Machine learning reshaping the future of transportation and mobility. In this class, we will show how DL can be used to teach autonomous vehicles to detect objects,
Afficher plus
Séances de cours associées (33)
Reconnaissance d'images : jeux de données et algorithmes
Explore un article de 2019 sur la reconnaissance d'images, les défis liés aux ensembles de données, les biais et l'impact des ensembles de données à grande échelle sur les modèles d'apprentissage en profondeur.
Réseaux convolutifs modernes et reconnaissance d'image
Explore l'évolution des réseaux convolutifs profonds et leur impact sur la précision de la reconnaissance d'images.
Apprentissage automatique avancé : sélection des fonctionnalités
Explore les algorithmes d'apprentissage automatique, les techniques de sélection des fonctionnalités telles que les descripteurs FAST et BRIEF, et les limites de l'apprentissage profond.
Afficher plus
Publications associées (70)

Robust NAS under adversarial training: benchmark, theory, and beyond

Volkan Cevher, Grigorios Chrysos, Fanghui Liu, Yongtao Wu

Recent developments in neural architecture search (NAS) emphasize the significance of considering robust architectures against malicious data. However, there is a notable absence of benchmark evaluations and theoretical guarantees for searching these robus ...
2024

Safety, tolerability and blinding efficiency of non-invasive deep transcranial temporal interference stimulation: first experience from more than 250 sessions

Friedhelm Christoph Hummel, Pierre Theopistos Vassiliadis, Elena Beanato, Fabienne Windel, Emma Marie D Stiennon, Maximilian Jonas Wessel

Objective. Selective neuromodulation of deep brain regions has for a long time only been possible through invasive approaches, because of the steep depth-focality trade-off of conventional non-invasive brain stimulation (NIBS) techniques. Approach. An appr ...
Bristol2024

Improved calorimetric particle identification in NA62 using machine learning techniques

Alessandro Mapelli, Radoslav Marchevski, Alina Kleimenova

Measurement of the ultra-rare K+ -> pi(+)nu(nu) over bar over bar decay at the NA62 experiment at CERN requires high-performance particle identification to distinguish muons from pions. Calorimetric identification currently in use, based on a boosted decis ...
New York2023
Afficher plus
Concepts associés (1)
Apprentissage profond
L'apprentissage profond ou apprentissage en profondeur (en anglais : deep learning, deep structured learning, hierarchical learning) est un sous-domaine de l’intelligence artificielle qui utilise des réseaux neuronaux pour résoudre des tâches complexes grâce à des architectures articulées de différentes transformations non linéaires. Ces techniques ont permis des progrès importants et rapides dans les domaines de l'analyse du signal sonore ou visuel et notamment de la reconnaissance faciale, de la reconnaissance vocale, de la vision par ordinateur, du traitement automatisé du langage.

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.