Publication

Structure-aware Multi-view 3D Reconstruction of Dislocations in TEM with Message Passing Neural Networks

Résumé

Efficient analysis of the three-dimensional (3D) shape and distribution of curvilinear crystal defects, namely dislocations, is an open research topic in material science and computer vision. In order to determine the structural and opto-electrical characteristics of the material, accurate 3D reconstructions of dislocations are required. In its current state, an established way to obtain 3D information of dislocations is electron tomography which relies on acquiring dozens of images from tilted sample for wide range of angles. Although tomography yields sufficient results in many cases, it is manually demanding to acquire, register and process dozens of images. In previous works [1, 2], it is shown that a classical stereo reconstruction approach may be applied as an alternative in order to increase reconstruction throughput while providing good performance. A later work [3] employing modern data-driven computer vision models showed that this stereo approach can be largely automatized and be used in various imaging conditions. In this work, we further improve the performance and memory consumption of previous convolutional neural network (CNN) based stereo reconstruction approach and extend it to be applicable in cases where more than two images are available. Our proposed multi-view approach directly incorporates the structural prior of dislocations to the model"s architecture and estimates 3D line segments approximating 3D shape of dislocations. In its core, our method has two stages which are structural connectivity estimation and depth estimation. In first stage, we employ a CNN to estimate affinity of sampled image locations on dislocation cores. This affinity information is used in the later depth estimation stage to eliminate the depth discontinuities on dislocations (Figure1). Unlike previous deep data-driven method, our new approach uses structural knowledge to separate depth estimations of different dislocation segments and yields more accurate reconstructions. In Figure 2, an example affinity estimation is shown for 4 different image locations on the same dislocation. It may be seen that dislocation points that are connected by dislocation segment in 3D results in higher affinity. This information is crucial to connect 3D point estimations and obtain linear structures in 3D.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
Concepts associés (34)
3D scanning
3D scanner is the process of analyzing a real-world object or environment to collect three dimensional data of its shape and possibly its appearance (e.g. color). The collected data can then be used to construct digital 3D models. A 3D scanner can be based on many different technologies, each with its own limitations, advantages and costs. Many limitations in the kind of objects that can be digitised are still present. For example, optical technology may encounter many difficulties with dark, shiny, reflective or transparent objects.
Dislocation
En science des matériaux, une dislocation est un défaut linéaire (c'est-à-dire non-ponctuel), correspondant à une discontinuité dans l'organisation de la structure cristalline. Une dislocation peut être vue simplement comme un "quantum" de déformation élémentaire au sein d'un cristal possédant un champ de contrainte à longue distance. Elle est caractérisée par : la direction de sa ligne ; un vecteur appelé « vecteur de Burgers » dont la norme représente l'amplitude de la déformation qu'elle engendre.
Vision par ordinateur
La vision par ordinateur est un domaine scientifique et une branche de l’intelligence artificielle qui traite de la façon dont les ordinateurs peuvent acquérir une compréhension de haut niveau à partir d's ou de vidéos numériques. Du point de vue de l'ingénierie, il cherche à comprendre et à automatiser les tâches que le système visuel humain peut effectuer. Les tâches de vision par ordinateur comprennent des procédés pour acquérir, traiter, et « comprendre » des images numériques, et extraire des données afin de produire des informations numériques ou symboliques, par ex.
Afficher plus
Publications associées (87)

Aggregating Spatial and Photometric Context for Photometric Stereo

David Honzátko

Photometric stereo, a computer vision technique for estimating the 3D shape of objects through images captured under varying illumination conditions, has been a topic of research for nearly four decades. In its general formulation, photometric stereo is an ...
EPFL2024

Enabling Uncertainty Estimation in Iterative Neural Networks

Pascal Fua, Nikita Durasov, Doruk Oner, Minh Hieu Lê

Turning pass-through network architectures into iterative ones, which use their own output as input, is a well-known approach for boosting performance. In this paper, we argue that such architectures offer an additional benefit: The convergence rate of the ...
2024

Advancing Self-Supervised Deep Learning for 3D Scene Understanding

Seyed Mohammad Mahdi Johari

Recent advancements in deep learning have revolutionized 3D computer vision, enabling the extraction of intricate 3D information from 2D images and video sequences. This thesis explores the application of deep learning in three crucial challenges of 3D com ...
EPFL2024
Afficher plus
MOOCs associés (22)
Algèbre Linéaire (Partie 1)
Un MOOC francophone d'algèbre linéaire accessible à tous, enseigné de manière rigoureuse et ne nécessitant aucun prérequis.
Algèbre Linéaire (Partie 1)
Un MOOC francophone d'algèbre linéaire accessible à tous, enseigné de manière rigoureuse et ne nécessitant aucun prérequis.
Algèbre Linéaire (Partie 2)
Un MOOC francophone d'algèbre linéaire accessible à tous, enseigné de manière rigoureuse et ne nécessitant aucun prérequis.
Afficher plus

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.