Publication

Efficient Lung Nodule Detection via 3D Deep Learning with Shifted Convolutions

Jiancheng Yang, Bo Du, Kang Yuan
2023
Article de conférence
Résumé

The high computational costs of deep convolutional neural networks hinder their deployment in real-world applications, including pulmonary nodule detection from CT scans where large 3D image sizes amplify the issue. This paper presents a novel 3D method to detect pulmonary nodules, based on anchor-free U-shaped networks, AFNet. A shifted convolution is further introduced to replace standard 3D convolutions, which reduces both the model sizes and FLOPs (floating-point operations). The shift operator is parameter-free, enabling 3D context fusion between CT slices using 2D convolutions. Extensive experiments on a large-scale lung nodule detection dataset validate the effectiveness of the proposed methods. The AFNet backbone is first proven to be comparable to the previous state of the art (e.g., NoduleNet). We then show that the proposed method with shifted convolutions balances model complexity and performance better than several lightweight methods, and generalizes well with different backbones. As an example, compared to the vanilla model, AFNet with shifted convolutions increases average FROC by 3.08% and reduces FLOPs (floating-point operations) and parameters by 62.40% and 66.62%, respectively.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
Concepts associés (32)
Produit de convolution
En mathématiques, le produit de convolution est un opérateur bilinéaire et un produit commutatif, généralement noté « ∗ », qui, à deux fonctions f et g sur un même domaine infini, fait correspondre une autre fonction « f ∗ g » sur ce domaine, qui en tout point de celui-ci est égale à l'intégrale sur l'entièreté du domaine (ou la somme si celui-ci est discret) d'une des deux fonctions autour de ce point, pondérée par l'autre fonction autour de l'origine — les deux fonctions étant parcourues en sens contraire
Tomodensitométrie
La tomodensitométrie (TDM), dite aussi scanographie, tomographie axiale calculée par ordinateur (TACO), CT-scan (CT : computed tomography), CAT-scan (CAT : computer-assisted tomography), ou simplement scanner ou scanneur pour l'appareil, est une technique d' qui consiste à mesurer l'absorption des rayons X par les tissus puis, par traitement informatique, à numériser et enfin reconstruire des images 2D ou 3D des structures anatomiques.
Réseau neuronal convolutif
En apprentissage automatique, un réseau de neurones convolutifs ou réseau de neurones à convolution (en anglais CNN ou ConvNet pour convolutional neural networks) est un type de réseau de neurones artificiels acycliques (feed-forward), dans lequel le motif de connexion entre les neurones est inspiré par le cortex visuel des animaux. Les neurones de cette région du cerveau sont arrangés de sorte qu'ils correspondent à des régions qui se chevauchent lors du pavage du champ visuel.
Afficher plus
Publications associées (35)

RibSeg v2: A Large-Scale Benchmark for Rib Labeling and Anatomical Centerline Extraction

Jiancheng Yang, Jason Ken Adhinarta, Ming Li

Automatic rib labeling and anatomical centerline extraction are common prerequisites for various clinical applications. Prior studies either use in-house datasets that are inaccessible to communities, or focus on rib segmentation that neglects the clinical ...
Piscataway2024

A 16-bit Floating-Point Near-SRAM Architecture for Low-power Sparse Matrix-Vector Multiplication

David Atienza Alonso, Giovanni Ansaloni, Grégoire Axel Eggermann, Marco Antonio Rios

State-of-the-art Artificial Intelligence (AI) algorithms, such as graph neural networks and recommendation systems, require floating-point computation of very large matrix multiplications over sparse data. Their execution in resource-constrained scenarios, ...
2023

3D representation of meso-voids location and morphology within the fibrous pore space of three carbon fabrics

Véronique Michaud, Helena Luisa Teixido Pedarros

Segmented meso-voids from a tomography scan of preforms impregnated under capillary dominated conditions, combined to 3D scans of the initial prefrom dry state. ...
EPFL Infoscience2023
Afficher plus
MOOCs associés (7)
Fundamentals of Biomedical Imaging: Ultrasounds, X-ray, positron emission tomography (PET) and applications
Learn how principles of basic science are integrated into major biomedical imaging modalities and the different techniques used, such as X-ray computed tomography (CT), ultrasounds and positron emissi
Fundamentals of Biomedical Imaging: Ultrasounds, X-ray, positron emission tomography (PET) and applications
Learn how principles of basic science are integrated into major biomedical imaging modalities and the different techniques used, such as X-ray computed tomography (CT), ultrasounds and positron emissi
Neuronal Dynamics - Computational Neuroscience of Single Neurons
The activity of neurons in the brain and the code used by these neurons is described by mathematical neuron models at different levels of detail.
Afficher plus