「Align then Refine」テキスト誘導による前立腺病変の3Dセグメンテーション
arXiv cs.CV / 2026/4/22
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- 本論文は、前立腺病変の3Dセグメンテーションを対象とし、既存モデルではモダリティ間の統合と病変レベルのセマンティクスが十分に扱えない点を課題としている。
- 3つの要点を組み込んだ新しいマルチエンコーダ型U-Netを提案し、(1) 整合損失で前景のテキスト画像類似度を強めて病変セマンティクスを注入し、(2) ヒートマップ損失で類似度マップを較正しながら背景の不正な活性化を抑制する。
- 最終段では、信頼度ゲート付きのマルチヘッド・クロスアテンション・リファイナーが、高信頼領域に限定して境界の局所的な修正(boundary edits)を行い、精度を高める。
- 複数コンポーネントの最適化を安定化するためにフェーズスケジュール学習を採用し、従来手法より一貫して優れ、PI-CAIデータセットで新たなSOTAを達成したと報告している。
- 提案手法の再現や発展研究のために、著者はコードを公開している。



