XAttnRes:医用画像セグメンテーションのためのクロスステージ・アテンション・リザビアル
arXiv cs.CV / 2026/4/7
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文では、医用画像セグメンテーションにおいて、事前のエンコーダ段およびデコーダ段の出力をグローバルな特徴履歴プールとして保持する新しい仕組み「Cross-Stage Attention Residuals(XAttnRes)」を提案する。
- XAttnResは軽量な疑似クエリ・アテンションを用いることで、各段が先行する表現すべてから必要な情報を選択的に集約できるようにし、固定的な残差結合よりも性能を向上させる。
- さらに、空間アラインメントとチャネル投影を追加し、LLM風の同一次元レイヤ間における特徴と、マルチスケールのエンコーダ-デコーダ型セグメンテーション・アーキテクチャとの間に存在する次元および解像度の差を橋渡しする。追加オーバーヘッドは最小限である。
- 3つの画像モダリティにまたがる4つのデータセットで実験を行った結果、既存モデルにXAttnResを組み込むと一貫してセグメンテーションの改善が得られることを示した。
- 著者らは、XAttnResが従来のスキップ接続なしでもベースラインと競合する結果を達成できると報告しており、学習されたアテンションに基づく集約によって、段間の情報伝達の一部を置き換えられることを示唆している。




