マンモグラフィROIの良性・悪性分類のためのハイブリッドアーキテクチャ

arXiv cs.CV / 2026/4/15

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、CBIS-DDSMにおけるROI(関心領域)レベルの2値分類により、マンモグラフィ病変の良性と悪性を正確に分類する必要性に取り組む。
  • 局所的な視覚パターンを抽出するためにEfficientNetV2-Mを用い、さらにVision Mamba(状態空間モデル)を採用して、二次計算コストのVision Transformerよりも効率的に大域的な文脈を捉えるハイブリッドモデルを提案する。
  • 動機として、CNNは長距離の依存関係を苦手とし、ViTは計算量面で過度に負担となり得ることが挙げられる。このため、提案手法は精度と効率の両立を狙う。
  • 著者らはROIベースの設定において病変レベルでの強い性能を報告し、線形計算量のシーケンスモデリング手法を医用画像分類における実用的な代替として位置付けている。

Abstract

マンモグラフィにおける疑わしい乳房病変の正確な特性評価は、早期診断および治療計画のために重要である。畳み込みニューラルネットワーク(CNNs)は局所的な視覚パターンの抽出に有効だが、長距離の依存関係をモデリングする点では適していない。Vision Transformers(ViTs)は自己注意によりこの制限を解決するが、その二次的な計算コストが負担となり得る。本論文では、局所特徴抽出にEfficientNetV2-Mを用い、効率的な大域的文脈モデリングに状態空間モデル(SSM)であるVision Mambaを組み合わせたハイブリッド・アーキテクチャを提案する。提案モデルは、CBIS-DDSMデータセットから異常が中心となるマンモグラフィの関心領域(ROIs)を、良性クラスと悪性クラスに二値分類する。強力なCNNバックボーンと、線形複雑度の系列モデルを組み合わせることで、この手法はROIベースの設定において病変レベルでの高い分類性能を達成する。