Publication

Advancing Self-Supervised Deep Learning for 3D Scene Understanding

Concepts associés (34)
Visual odometry
In robotics and computer vision, visual odometry is the process of determining the position and orientation of a robot by analyzing the associated camera images. It has been used in a wide variety of robotic applications, such as on the Mars Exploration Rovers. In navigation, odometry is the use of data from the movement of actuators to estimate change in position over time through devices such as rotary encoders to measure wheel rotations.
3D rendering
3D rendering is the 3D computer graphics process of converting 3D models into 2D images on a computer. 3D renders may include photorealistic effects or non-photorealistic styles. Rendering is the final process of creating the actual 2D image or animation from the prepared scene. This can be compared to taking a photo or filming the scene after the setup is finished in real life. Several different, and often specialized, rendering methods have been developed.
Apprentissage de représentations
En apprentissage automatique, l'apprentissage des caractéristiques ou apprentissage des représentations est un ensemble de techniques qui permet à un système de découvrir automatiquement les représentations nécessaires à la détection ou à la classification des caractéristiques à partir de données brutes. Cela remplace l'ingénierie manuelle des fonctionnalités et permet à une machine d'apprendre les fonctionnalités et de les utiliser pour effectuer une tâche spécifique.
Graphic art software
Graphic art software is a subclass of application software used for graphic design, multimedia development, stylized , technical illustration, general , or simply to access graphic files. Art software uses either raster or vector graphic reading and editing methods to create, edit, and view art. Many artists and other creative professionals today use personal computers rather than traditional media.
Transformeur
vignette|Schéma représentant l'architecture générale d'un transformeur. Un transformeur (ou modèle auto-attentif) est un modèle d'apprentissage profond introduit en 2017, utilisé principalement dans le domaine du traitement automatique des langues (TAL). Dès 2020, les transformeurs commencent aussi à trouver une application en matière de vision par ordinateur par la création des vision transformers (ViT).
Modélisation tridimensionnelle
La modélisation tridimensionnelle est l'étape en infographie tridimensionnelle qui consiste à créer, dans un logiciel de modélisation 3D, un objet en trois dimensions, par ajout, soustraction et modifications de ses constituants. La révolution consiste à faire tourner un profil 2D autour d'un axe 3D : on obtient ainsi un volume de révolution. C'est la technique majoritairement utilisée dans le jeu vidéo, et le cinéma d'animation. La modélisation polygonale induit une marge d'erreur de proportions et de dimensions le plus souvent invisible à l'œil nu.
Réflectivité bidirectionnelle
Dans de nombreux problèmes de transferts thermiques ou en rendu pour la génération d'images de synthèse il est nécessaire de caractériser la réflexion d'une surface. Le cas le plus simple est la réflexion spéculaire décrite par les lois de Fresnel mais qui ne s'adresse qu'à des surfaces parfaites. De telles surfaces sont réalisées dans divers domaines technologiques et on peut dans ce cas prédire, outre la réflexion, des propriétés telles que absorptivité ou émissivité.
Rendu physique réaliste
vignette|Texture de plaque métallique à losanges, représentée en gros plan via un rendu physique réaliste. Les petites abrasions donnent au métal un aspect rugueux. Une normal map est utilisée pour représenter les reliefs de la texture.Le terme rendu physique réaliste (en anglais, Physically Based Rendering, ou ) regroupe un ensemble de techniques de rendu de scène 3D, qui imitent les modèles physiques décrivant le comportement de la lumière dans le monde réel.
Rendu volumique direct
Le rendu volumique direct est une technique utilisée pour afficher une projection 2D d'une série de données 3D. Le rendu volumique direct nécessite que chaque valeur échantillonnée au sein du volume soit associée à une opacité et une couleur. Mathématiquement, cela revient à dire qu'on dispose d'une fonction de transfert : où est la région de l'espace où la fonction est définie, et est l'espace de couleurs utilisé (par exemple ou si les couleurs sont définies par leurs valeurs RGB).
Recherche automatique d'architecture neuronale
La recherche automatique d'architecture neuronale (Neural Architecture Search, NAS) est un ensemble de techniques visant à découvrir automatiquement de nouveaux modèles de réseaux de neurones artificiels. Les principales méthodes employées dans la littérature sont basées soit sur de l'apprentissage par renforcement, sur de la descente de gradient ou bien sur des algorithmes génétiques. Plusieurs méthodes NAS parviennent à obtenir des architectures qui atteignent ou surpassent les performances des modèles créés à la main.

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.