Mixture-of-Experts 全スライド画像分類のためのリージョン・グラフ最適輸送ルーティング

arXiv cs.CV / 2026/4/9

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、ギガピクセル級の全スライド画像(WSI)分類におけるマルチプル・インスタンス・ラーニング(MIL)向けの、空間認識型Mixture-of-Experts(MoE)アグリゲータであるROAMを提案し、病理のヘテロジェネイティ(多様性)をより適切に扱うことを目的とする。
  • ROAMは、キャパシティ制約付きのエントロピー最適輸送(Sinkhornにより実装)を用いて、空間(spatial)の領域トークンを専門サブネットワークへルーティングし、追加の負荷分散用損失項に頼らずに、専門家(エキスパート)の利用をバランス良く保つことを強制する。
  • さらに、空間領域グラフ上でルーティング割当を拡散させるグラフ正則化付きSinkhorn反復を追加し、近傍の領域が同じエキスパートへ一貫してルーティングすることを促す。
  • 4つのWSIベンチマークで、凍結した基盤モデルのパッチ埋め込み(foundation-model patch embeddings)を用いた実験の結果、ROAMは強力なMILおよびMoEのベースラインと競争力のある性能を示す。またTCGA-CPTACにおける外部NSCLC一般化AUCとして0.845 ± 0.019を報告している。