Architectures CNN–Transformer orientées cliniquement pour une reconnaissance fiable des lésions pulmonaires et des structures anatomiques en bronchoscopie

18 mars 2026 | Actualité

Avec un taux de survie à 5 ans de seulement 15 à 20 %, principalement dû à un diagnostic tardif et au fait que la moitié des cas sont découverts à un stade avancé [1], le cancer du poumon est l’une des principales causes de décès dans le monde, avec environ 1,8 million de décès et 2,2 millions de nouveaux cas détectés en 2020 [2].

La reconnaissance précoce des lésions cancéreuses pulmonaires est donc essentielle pour améliorer le pronostic des patients. Parmi les différentes méthodes diagnostiques, la bronchoscopie se distingue en permettant une visualisation directe des voies respiratoires et en rendant possibles des examens histopathologiques de confirmation [3]. Pour les tumeurs centrales, cette technique d’imagerie médicale présente une sensibilité pouvant atteindre 88 %, mais son efficacité diminue pour les lésions périphériques, avec une sensibilité comprise entre 50 % et 78 % selon les méthodes utilisées [4].

Cependant, l’interprétation visuelle des images bronchoscopiques repose largement sur l’expérience du clinicien, ce qui entraîne une variabilité importante entre observateurs [5]. Cela constitue une limite majeure de cet outil diagnostique, car cela augmente le risque de faux négatifs et de lésions non détectées, en particulier pour les anomalies subtiles [6]. Ainsi, l’intégration de solutions basées sur l’intelligence artificielle apparaît comme une approche pertinente pour optimiser l’interprétation et la précision des diagnostics en bronchoscopie.

Les modèles d’IA ont démontré un fort potentiel pour la reconnaissance automatisée des structures anatomiques et des lésions cancéreuses. En particulier, les approches hybrides CNN-Transformer combinent la capacité des CNN à extraire des caractéristiques locales avec la puissance des Transformers à capturer des caractéristiques globales, permettant une analyse avancée des images médicales. Leur adoption croissante en imagerie médicale démontre leur pertinence dans la classification des maladies pulmonaires [7] (précision de 98,97 %), la détection de tumeurs cérébrales et gastro-intestinales [8], ainsi que la segmentation d’organes dans les scanners CT [9] et la segmentation de polypes en endoscopie [10]. Cela suggère que les approches hybrides CNN–Transformer peuvent compléter ou améliorer les architectures traditionnelles dans certaines tâches d’imagerie, en particulier lorsque les détails locaux et le contexte global sont tous deux nécessaires.

Parallèlement, des études récentes ont également exploré des techniques de super-résolution en endoscopie afin d’améliorer la qualité visuelle des images médicales, soit en augmentant la résolution des vues endoscopiques stéréoscopiques [11], soit en améliorant la segmentation des instruments chirurgicaux grâce à des approches basées sur l’apprentissage profond [12].

En bronchoscopie, de nombreuses études récentes ont démontré l’apport des modèles de machine learning et de deep learning pour l’analyse des images bronchoscopiques et l’aide à la décision clinique : Deng et al. [13] ont conçu un modèle inspiré de ResNet atteignant 95 % de précision pour distinguer les lésions malignes des lésions bénignes, tandis que Feng et al. [14] ont extrait des caractéristiques de texture HSV pour classer les sous-types de cancer du poumon avec une précision de 86 %. Un modèle multitâche basé sur DenseNet, capable de différencier le cancer de la tuberculose avec une précision de 90,6 %, a été introduit par Setayeshi et al. en 2024 [15]. Pour la navigation, Banach et al. [16] ont utilisé un cycle-GAN pour estimer la profondeur et aligner les images bronchoscopiques avec des scans 3D, et Chang et al. ont proposé ESFPNet [17], un modèle de segmentation en temps réel des lésions en autofluorescence atteignant un indice de Dice de 0,76. Yoo et al. ont entraîné EfficientNet-B1 [18] pour identifier les structures bronchiques, surpassant les médecins en précision, et Cold et al. ont démontré [17] que l’IA pouvait guider les opérateurs en temps réel, augmentant le nombre de segments explorés (+6 en moyenne). Pour l’évaluation des performances, Cold et al. ont développé AIBA, un système automatisé corrélé aux évaluations humaines, et Cold et al. [20] ont prouvé que l’assistance par IA optimise la qualité de la bronchoscopie, rendant les procédures plus complètes et standardisées.

Néanmoins, une limite méthodologique peut affecter nombre de ces avancées : la plupart des travaux publiés ne précisent pas explicitement leur stratégie de partitionnement des données, ce qui suggère qu’un découpage aléatoire au niveau des images a pu être appliqué. Une telle pratique permettrait implicitement à des données provenant d’un même patient d’apparaître à la fois dans les ensembles d’entraînement et de test, augmentant le risque de surestimation des performances en raison de fuites de données. Bien que souvent négligé, ce problème méthodologique remet en question la véritable capacité de généralisation des modèles rapportés et souligne l’importance d’adopter des protocoles d’évaluation plus stricts au niveau des patients. De plus, au-delà de cette problématique, le domaine souffre encore d’un manque de jeux de données publics de grande taille et richement annotés dédiés à la bronchoscopie. Cette rareté des données de référence limite la reproductibilité et la comparaison objective des modèles d’IA, et freine leur transfert vers la pratique clinique.

À cet égard, le jeu de données BM-BronchoLC, publié en 2024 [21], représente une avancée majeure dans ce domaine. Il s’agit de l’un des premiers ensembles de données publics richement annotés spécifiquement conçus pour l’analyse d’images bronchoscopiques, permettant l’entraînement et l’évaluation de modèles de segmentation et de classification des lésions cancéreuses et des repères anatomiques. Ce jeu de données constitue une référence précieuse pour tester les architectures d’IA et évaluer les performances des algorithmes de reconnaissance des lésions pulmonaires et des structures anatomiques dans des conditions cohérentes et reproductibles.

Téléchargez l’article pour le lire en intégralité.