白血球分類のためのヘッド多様性アンサンブルを用いた病理ファウンデーションモデルのマルチステージ微調整

arXiv cs.CV / 2026/3/24

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、白血球(WBC)の13クラス分類に対し、白血病診断タスクで見られるクラス不均衡、ドメインシフト、ならびに形態の連続性による混同に対処するためのマルチステージ微調整アプローチを提案する。
  • DINOBloomベースのモデルを微調整し、複数の分類器ヘッドファミリ(線形、コサイン、MLP)を用いることで検討し、異なるヘッドが成熟段階ごとに専門化することを見出す(コサインは成熟顆粒球、線形はより未成熟のもの、MLPは最も未成熟のものに適する)。
  • この専門化を活用して、著者らはヘッド多様性アンサンブルを構築する。主にMLPヘッドの予測に依存しつつ、事前に定義した混同ペアにおいて他のヘッドが一致する場合に限り、予測を条件付きで置き換える。
  • また、全モデルで一貫して誤分類されるサンプルは、あり得るラベル誤りまたは本質的に曖昧な形態を含む割合が高いことを報告しており、モデルの分離可能性の限界と、データ品質に関する価値の可能性を示唆する。
  • 本研究はWBCBench 2026チャレンジ(ISBI 2026)での評価に向けて位置づけられており、ベンチマーク駆動による手法の検証を目的としている。

要旨: 周辺血塗抹標本からの白血球(WBC)の分類は、白血病の診断にとって重要です。しかし、自動化アプローチは依然として、クラス不均衡、ドメインシフト、形態学的連続体の混同といった課題により困難を抱えています。ここでいう形態学的連続体の混同とは、隣接する成熟段階がわずかに重なり合う特徴を示すために識別が難しくなる状況です。本研究では、WBCBench 2026 チャレンジ(ISBI 2026)における13クラスのWBC分類に対して、マルチステージのファインチューニング手法を提案します。最も性能の高いモデルは、ファインチューニングした DINOBloom-base であり、その上で複数の分類器ヘッドのファミリー(線形、コサイン、ならびにマルチレイヤー・パーセプトロン(MLP))を学習します。コサイン・ヘッドは成熟顆粒球の境界(Band neutrophil(BNE)F1 = 0.470)で最も良好な性能を示し、線形ヘッドはより未成熟な顆粒球クラス(Metamyelocyte(MMY)F1 = 0.585)で優れ、MLPヘッドは最も未成熟な顆粒球(Promyelocyte(PMY)F1 = 0.733)で最良となり、クラス固有の専門化が明らかになりました。この専門化に基づいて、ヘッド多様性(head-diverse)のアンサンブルを構築します。ここではMLPヘッドを主要な予測器とし、あらかじめ定義した4つの混同ペアの範囲内におけるその予測は、他の2つのヘッドファミリーが一致した場合に限って置き換えます。さらに、すべてのモデルで一貫して誤分類される症例は、あり得るラベリング誤り、または内在的な形態学的曖昧さのいずれかにより、実質的に多く含まれていることを示します。