サブ領域を意識したプロンプトによる階層的テキスト誘導ブレイントモール分割

arXiv cs.CV / 2026/3/24

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、臨床的に定義された3つのサブ領域(WT, TC, ET)の間に曖昧な境界が存在することによって生じる、脳腫瘍の分割課題に取り組む。
  • 単一のグローバルなテキスト埋め込みですべての領域を扱うのではなく、包含関係に基づくWT→TC→ETの順序で粗→精の階層的分割を行うテキスト誘導フレームワークTextCSPを提案する。
  • TextCSPは、学習可能なソフトプロンプトと、LoRA適応したBioBERTエンコーダを用いたサブ領域に応じたプロンプトチューニングを導入し、サブ領域ごとに特化したテキスト表現を生成する。
  • また、テキストの意味論的チャネルモジュレータによって、これらの表現をチャネル単位の改良(リファインメント)信号へと変換し、臨床的に記述されたパターンへデコーダを誘導する仕組みも用いる。
  • TextBraTSデータセット上で、本手法は先行の最先端手法に対してサブ領域すべてで一貫した改善を報告しており、DiceとHD95をそれぞれサブ領域平均で1.7%および6%向上させる。

Abstract

脳腫瘍のセグメンテーションは、3つの標準的なサブ領域、すなわち全腫瘍(WT)、腫瘍コア(TC)、造影腫瘍(ET)が、しばしば曖昧な視覚的境界を示すため、依然として困難です。放射線学的記述文と画像を統合することは有望であることが示されています。しかし、ほとんどのマルチモーダル手法は、レポートを単一のグローバルなテキスト埋め込みへ圧縮し、それをすべてのサブ領域で共有するため、それぞれのサブ領域の固有の臨床的特性を見落としがちです。私たちはTextCSP(text-modulated soft cascade architecture)を提案します。これは、TextBraTSのベースラインに基づき、3つの新規コンポーネントを備えた階層的なテキストガイド型フレームワークです。(1)テキストで変調されたソフトカスケードデコーダで、解剖学的な内包関係に整合する粗い〜細かい段階的な方法により WT→TC→ET を予測します。(2)サブ領域に応じたプロンプト調整。LoRA適応したBioBERTエンコーダと、学習可能なソフトプロンプトを用いて、各サブ領域に合わせた専門化されたテキスト表現を生成します。(3)前述の表現をチャネルごとのリファインメント信号へ変換するテキストセマンティクス・チャネルモジュレータにより、デコーダが臨床的に記述されたパターンに整合する特徴を強調できるようにします。TextBraTSデータセットでの実験では、主要指標であるDiceおよびHD95において、最先端手法に対してすべてのサブ領域で一貫した改善が確認され、改善幅はそれぞれ1.7%および6%です。