\emph{foundation-model embeddings} を導入すること、そして (2) グラフニューラルネットワークに加えて新しい {
\em jigsaw regularization} を用いることで、パッチ間の空間的な認識を実現することです。これら2つの特徴の組み合わせにより、乳がん、頭頸部がん、大腸がんのベンチマークデータセットにおいて、最先端の注意機構ベースMIL手法に比べて分類性能が大幅に向上することを見出しました。
全スライド画像分類におけるジグソー正則化
arXiv cs.CV / 2026/3/24
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は計算病理学における全スライド画像(WSI)分類を扱い、スライド単位のラベルを、多数のインスタンス学習(MIL)を用いてラベルなしパッチから推定する必要がある点を扱っている。
- 多くのMIL手法ではパッチが交換可能であるという仮定が置かれているため、組織画像に固有の空間的・位相的な構造を見落としてしまうと主張する。
- 提案手法は、パッチ内の局所構造を符号化するための基盤モデル埋め込みと、パッチ間の関係をモデル化するグラフニューラルネットワークを組み合わせることで、空間認識を向上させる。
- 主要な新規性は、「ジグソー正則化(jigsaw regularization)」の導入であり、グラフ枠組みにおけるパッチ間の空間学習を強化することを目的とした新しい正則化戦略である。
- 乳がん、頭頸部がん、大腸がんのベンチマークデータセットでの実験により、組み合わせ手法が従来の最先端の注意ベースMIL手法よりも高い性能を示すことが確認された。

