複数データセットによる3D神経画像分類のための多重インスタンス学習ベンチマーク
arXiv cs.LG / 2026/4/30
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、CT/MRIの3D神経画像分類において、多重インスタンス学習(MIL)手法を3D CNNや3Dビジョントランスフォーマーと比較し、3つのCTと4つのMRIデータセット(10,000件以上を含む大規模データセット2つ)で評価しています。
- 訓練の効率化のため、2D画像エンコーダを凍結してプーリング機構と分類器のみを学習する深層MIL設定に焦点を当て、リソース制約のある実務者が有効なネットワークを選べるようにすることを目的としています。
- 結果として、学習可能な注意機構を持たない単純な平均プーリングMILが、6つの中規模タスクのうち4つで、より複雑なMILや3D CNNの代替案と同等、または上回る性能を示しています。
- 大規模データセット2つでも平均プーリングのベースラインは競争力を維持しつつ、学習が最大25倍速いと報告されており、実用上の効率改善が大きいことを示しています。
- 平均プーリングが機能する理由(スライスごとの注意の質など)を分析し、ベイズ推定により最良の分類器を導ける半合成データセットを用いて、既存MILの限界を明らかにし、今後の改善方向を示唆しています。