要旨:
胸部X線撮影は世界中の肺および心臓疾患の主要な診断ツールであり続けるが、その正確性は放射線科医の不足と観察者間のばらつきによって妨げられている。本研究は、胸部疾患の多クラス分類のための7つの深層学習アーキテクチャを体系的に比較評価した。対象アーキテクチャは ConvNeXt-Tiny、DenseNet121、DenseNet201、ResNet50、ViT-B/16、EfficientNetV2-M、MobileNetV2。
5つの疾患カテゴリ(心拡大、COVID-19、正常、肺炎、結核)を網羅する18,080枚の胸部X線画像からなるバランスの取れたデータセットを、3つの公開リポジトリから構築し、データ漏洩を防ぐため患者レベルで分割した。すべてのモデルは、ImageNetで事前学習済みの重み、標準化された前処理、統一されたハイパーパラメータを用いて、同一条件で訓練された。
7つのアーキテクチャはすべて90%以上のテスト精度を超えた。ConvNeXt-Tinyは最高の性能を達成(精度92.31%、AUROC 95.70%)、一方MobileNetV2は最もパラメータ効率の良いモデルとして浮上(パラメータ数3.5M、精度90.42%、AUROC 94.10%、訓練は48分で完了)。結核とCOVID-19の分類は、すべてのアーキテクチャでほぼ完璧だった(AUROC ≥ 99.97%)、一方で正常、心拡大、肺炎は放射線像の特徴が重なるためより難易度が高かった。Grad-CAMの視覚化は、疾患カテゴリ全体で臨床的に一貫した注視パターンを確認した。
これらの知見は、資源豊富な医療環境と資源制約のある医療環境の両方において、過度な計算資源を必要とせずに高精度な多疾患胸部X線分類が実現可能であることを示しており、AI支援診断の重要な示唆をもたらす。
単一ラベル胸部X線画像に対する多疾患分類のための深層学習アーキテクチャの比較分析
arXiv cs.CV / 2026/3/17
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本研究では、7つのアーキテクチャ(ConvNeXt-Tiny、DenseNet121/201、ResNet50、ViT-B/16、EfficientNetV2-M、MobileNetV2)を、5つの疾患カテゴリーにわたる多クラス胸部X線分類のため、18,080枚の均衡データセットを用いて体系的に比較した。
- すべてのモデルがテスト精度90%を超え、ConvNeXt-Tinyが総合性能で最高を記録した(92.31%の精度、95.70%のAUROC)。
- MobileNetV2は最もパラメータ効率が高く(350万パラメータ)、90.42%の精度、94.10%のAUROCを達成し、学習には48分を要した。
- 結核とCOVID-19は全アーキテクチャでほぼ完璧なAUROC(≥99.97%)を達成した一方、Normal(健常)、Cardiomegaly(心肥大)、Pneumonia(肺炎)は特徴の重ね合わせによりより困難だった。
- Grad-CAMの可視化は臨床的に一貫した注意パターンを示し、多様な医療現場でのAI支援診断の解釈性を支持した。


