Dino-NestedUNet:病理腫瘍バルク分割のための基盤ビジョンエンコーダを「密なデコーディング」で解き放つ

arXiv cs.CV / 2026/5/5

📰 ニュースModels & Research

要点

  • この論文では、事前学習済みDINOv3エンコーダと「Nested Dense Decoder」を組み合わせ、病理における腫瘍バルク分割で境界をより正確に再構成する枠組みDino-NestedUNetを提案しています。
  • 従来はVFMを凍結し軽量デコーダを付けることが多く、その結果として能力(キャパシティ)の不一致が生じ、浸潤性の腫瘍で境界の再現精度が低下しがちだと主張しています。
  • 提案手法では、疎なスキップ接続や単純なアップサンプリングに代えて、中間経路を密な格子状に構成し、特徴の連続的な再利用とマルチスケールでの再調整をデコーディング中に可能にしています。
  • CHTN、OSU、CAMELYON16の3つの病理コホートでUNet++や標準的なDino-UNetより一貫して改善が見られ、特にドメインシフト下で効果が大きいと報告されています。
  • さらに、CHTNで学習してTIGER WSIBULKとOSU CRCを微調整なしで直接評価するゼロショット検証でも良好な外部汎化が示され、境界に敏感な分割課題で「密なデコーディング」が重要な要素であることが示唆されています。

概要: DINOv3のようなビジョン・ファウンデーションモデル(VFM)は、計算病理にとって有望な豊かな意味表現を提供します。しかし、現在の多くの適応では、凍結したVFMに軽量デコーダを組み合わせることが多く、その結果として能力の不一致が生じ、浸潤性腫瘍のバルク領域のセグメンテーションにおいて境界の忠実度がしばしば制限されます。本論文では、事前学習済みのDINOv3エンコーダとNested Dense Decoderを結合するフレームワークであるDino-NestedUNetを提示します。疎なスキップ接続や線形のアップサンプリングの代わりに、提案するデコーダは、連続的な特徴再利用とマルチスケールの再調整を可能にする中間経路の密なグリッドを形成し、再構成の過程で高レベルの意味論を低レベルの形態学的なテクスチャへと整合させます。Dino-NestedUNetを3つの組織病理コホート(マルチセンターのCHTN、施設内のOSU、CAMELYON16)で評価し、UNet++および標準的なDino-UNetバリアントに対して一貫した改善が見られ、特にドメイン間シフト下で顕著でした。外部一般化をさらに評価するために、CHTNで学習し、微調整を行わずに、未見のTIGER WSIBULKおよびOSU CRCコホートで直接テストすることで、ゼロショット評価を実施します。これらの結果は、境界に敏感な病理セグメンテーションでファウンデーション・エンコーダを解き放つための重要な要素が、密なデコーディングであることを示唆しています。