TopoMamba:異種医用視覚メディアのセグメンテーションのためのトポロジー対応スキャンとフュージョン

arXiv cs.CV / 2026/4/29

📰 ニュースDeveloper Stack & InfrastructureIndustry & Market MovesModels & Research

要点

  • TopoMambaは、視覚状態空間モデルの医用画像セグメンテーション性能を、軸に偏ったスキャン順序と多分岐フュージョンの非効率という実務上の課題により改善するためのトポロジー対応スキャン・フュージョン手法である。
  • この手法は、対角/反対角のTopoA-Scanブランチと標準的なCross-Scanブランチを組み合わせ、斜めや曲線をもつ構造の表現をより良くする。
  • ScanCacheとして、繰り返し現れる解像度に対してスキャンインデックス構築の負荷をならすデバイス対応キャッシュ機構を導入している。
  • 異種スキャン特徴の効率的な融合のために、ブランチ間相互作用を依存性に基づくスカラー・ゲーティングで制御する軽量なHSIC Gateを提案する。
  • Synapse CT、ISIC 2017(デスモスコピー)、CVC-ClinicDB(内視鏡)での実験と、実運用の3Dセグメンテーション向けTopoMamba-3Dで、CNN・Transformer・SSMの強力なベースラインに対して一貫した改善を示し、特に膵臓や胆嚢などの細く曲がった対象で効果が明確でありつつ、動的な入力解像度下でも展開効率を維持している。

要旨: 画像の視覚状態空間モデル(SSM)は医用画像セグメンテーションにおいて強い可能性を示しているものの、その有効性はしばしば2つの実務上の課題によって制限されます。すなわち、軸に偏った走査順序が斜めで曲がりくねった構造のモデリングを弱めること、そして素朴なマルチブランチ融合が冗長な応答を増幅しがちなことです。私たちは、不均一な医用視覚メディアをセグメント化するための、トポロジー認識型のスキャン・アンド・フューズ枠組みである TopoMamba を提案します。この手法は、対角/反対角の TopoA-Scan ブランチと標準の Cross-Scan ブランチを組み合わせて補完的な構造の事前知識を与え、さらに、繰り返し出現する解像度にわたって明示的なスキャン・インデックス構築のコストを償却するデバイス認識型のキャッシュ機構である ScanCache を導入します。不均一なスキャン特徴を効率的に融合するために、依存性を考慮したスカラー・ゲーティング則でブランチ間の相互作用を制御する軽量な HSIC Gate も提案します。また、実運用の3D臨床セグメンテーションのために、体積(ボリュメトリック)TopoMamba-3D を具体化します。Synapse CT、ISIC 2017 デルモスコピー、CVC-ClinicDB 内視鏡に関する実験では、TopoMamba が強力な CNN、Transformer、SSM のベースラインに比べて一貫してセグメンテーション品質を向上させることが示されています。特に膵臓や胆のうのような細い/曲がった対象で改善が明確であり、入力解像度が動的に変化する状況下でも、良好なデプロイ効率を維持します。これらの結果は、トポロジー認識型の走査順序と、軽量な依存性を考慮した融合が、医用マルチメディア・セグメンテーションに対して有効で実用的な設計を形成することを示唆しています。コードは公開される予定です。