異種病理基盤モデルのためのプラグアンドプレイ・ロジット融合(Plug-and-Play Logit Fusion)

arXiv cs.CV / 2026/4/10

💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • 本論文は、独立に学習された複数の病理基盤モデル(FM)予測器を固定のエキスパートとして組み合わせ、スライド単位の出力からサンプル適応的な融合重みを学習する、プラグアンドプレイのロジットのみの融合手法「LogitProd」を提案する。
  • LogitProdは、異種のバックボーン間での特徴空間の整合を行ったり高コストなエンコーダ再学習を行ったりせず、ロジットのみに基づいて動作するため、既存の複数モデルによるヒストパソロジー・パイプラインを容易にアップグレードできる。
  • 著者らは、学習された重み付き積(最適重み付き積融合)が、学習目的のもとで最良の単一エキスパートと少なくとも同等の性能を達成することを保証する理論的根拠を提示している。
  • WSI分類、タイル分類、遺伝子変異予測、離散時間のサバイバルモデリングを含む22の病理ベンチマークにおいて、LogitProdは20/22のタスクで最高性能を達成し、最強の単一エキスパートに比べて平均結果を約3%改善する。
  • 特徴融合アプローチと比較して、本手法は学習コストを約12×削減し、病理FMの増加によって生じる実務上のモデル選択ボトルネックに対処する。

Abstract

病理基盤モデル(FM)は計算病理学の中核となりつつあり、幅広い診断および予後タスクに対して強力な転移性能を提供します。しかし、病理基盤モデルの急速な増殖はモデル選択のボトルネックを生み出しています。すべての下流エンドポイントに対して、多数の候補をそれぞれ徹底的に適応・検証することは、費用面で現実的に不可能である一方、単一のモデルが一様に最良であるわけでもありません。この課題に対し、軽量かつ新規のモデル融合戦略であるLogitProdを提案します。LogitProdは、独立に学習されたFMベースの予測器を固定されたエキスパートとして扱い、スライド単位の出力に対してサンプル適応的な融合重みを学習します。融合は純粋にログit上で行われ、エンコーダの再学習も不要で、異種のバックボーン間での特徴空間の整合(アライメント)も必要ありません。さらに、最適な重み付き積の融合が、学習目的のもとで最良の個別エキスパートと同等以上の性能を必ず達成することを保証する理論的分析を示します。私たちは、WSIレベル分類、タイルレベル分類、遺伝子変異予測、離散時間の生存モデリングにまたがる extbf{22}のベンチマークに対して、LogitProdを体系的に評価します。LogitProdは22タスク中20タスクで1位となり、最強の単一エキスパートに比べて全タスク平均の性能を約3%向上させます。LogitProdにより、実務者は異種のFMベースのパイプラインをプラグアンドプレイ方式でアップグレードでき、特徴融合の代替案よりも約12倍低い学習コストで複数エキスパートの利得を得られます。