汎がん認識とテキストガイド腫瘍局在化のための統一マルチ・基盤モデルによるスライド表現

arXiv cs.CV / 2026/4/28

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文ではASTRAという汎がんフレームワークを提案し、複数の病理基盤モデルが持つ断片的なタイル表現を、臨床的なスライド推論に必要な共通のスライド表現空間へ統合します。
  • ASTRAは、分類カテゴリ、がん種、解剖学的部位といった構造化病理メタデータにより、この共通空間を意味的にアンカーし、解釈可能性とテキストガイド局在化を可能にします。
  • 手法はスパースなミクスチャ・オブ・エキスパートによる文脈化、マスク付きのマルチモデル再構成、構造化された病理プロンプトとのコントラスト整合を用い、複数レベルの分類と弱教師ありの腫瘍局在化を支えるスライド表現を学習します。
  • CHTNコホート(16腫瘍タイプ、10,359枚のWSI)で学習し、4種類の基盤モデルバックボーンすべてで汎がん分類の性能を改善し、4カテゴリ分類で最大97.8%マクロAUC、3クラス腫瘍タイピングで99.7%、16クラスで99.2%を達成します。
  • 局在化では、インドメインの注釈付きサブセット(n=380)で平均Dice 0.897、外部TCGAサブセット(n=1,686)で0.738を達成し、ピクセルレベルの教師なしで高い汎化性能を示しています。

要旨: 病理基盤モデルの拡大するエコシステムにより強力だが断片的なタイルレベル表現が生み出されてきた一方で、統合されたスライドレベルの推論と、臨床的に意味のある情報への解釈可能な対応付けを必要とする臨床タスクでの利用が制限されていました。我々は、分類カテゴリ、がん種、解剖学的部位を含む構造化された病理アノテーション項目によって、その表現空間に意味的根拠を与えつつ、異種の基盤モデル表現を共通のスライドレベル表現空間に統合する汎がん(pan-cancer)フレームワークASTRAを提案します。ASTRAは、スパースなミクスチャ・オブ・エキスパートによる文脈化、マスク付きマルチモデル再構成、構造化された病理プロンプトとのコントラスト的整合を組み合わせることで、ピクセルレベルの教師なしで、4カテゴリ分類、3クラスの固形腫瘍タイピング、16クラスのがんタイピング、ならびにテキストに導かれた腫瘍局在化を支えるスライド表現を学習します。16腫瘍タイプにまたがる10,359枚の全スライド画像(WSI)からなるCHTNコホートで開発されたASTRAは、4つの病理基盤モデルのバックボーンすべてにおいて汎がん分類を一貫して改善し、4カテゴリ分類で最大97.8%のマクロ-AUC、3クラスの固形腫瘍タイピングで99.7%、16クラスのがんタイピングで99.2%を達成します。腫瘍局在化においてASTRAは、アノテーション付きのドメイン内CHTNサブセット(n = 380)で平均Dice 0.897、外部TCGAコホート(n = 1,686)で4がんタイプにまたがり平均Dice 0.738を達成します。これらの結果は、スライドレベルのメタデータから導出される最小限の構造化病理アノテーション項目が、統一スライド表現学習に対して有効な意味的教師信号を提供し、単一の枠組みの中で汎がん予測と弱教師付き腫瘍局在化の両方を可能にすることを示しています。