要旨: 多様で異種の医用画像データセットから得られる知識を活用し、セグメンテーション、分類、物体検出の各タスクにおける性能を向上させる統一的なドメイン間転移学習フレームワークを提案する。提案手法では、複数のソースデータセットから学習されたドメイン不変表現を統合する教師モデルと、それに基づいてタスク固有の学生モデルを多段階の知識蒸留によって訓練する教師―学生(teacher-student)パラダイムを用いる。もともとは医用画像セグメンテーション向けに開発されたこのフレームワークを、画像レベルの分類と物体レベルの検出に対応するよう拡張し、医用画像解析のための汎用的なマルチタスク定式化を可能にする。提案手法を、6つのセグメンテーションのベンチマーク(BrainMetShare、ISLES、BraTS(MRI)、Lung MSD、LiTS、KiTS(CT))に加え、肺疾患と認知症の複数の分類データセット、ならびにネイティブなバウンディングボックス注釈を持つ検出データセットを含む幅広いデータセット群で評価する。すべてのタスクとモダリティにおいて、本提案手法は強力なデータセット固有ベースラインおよびマルチヘッドベースラインに対して一貫した改善をもたらし、分布シフトへの頑健性の向上と優れた汎化性能を示す。これらの結果は、異種の医用画像ドメインにわたってセグメンテーション、分類、物体検出の性能を向上させるための、スケーラブルでタスク非依存な手法としてのマルチデータセット知識蒸留の可能性を浮き彫りにする。
複数データセット横断ドメイン知識蒸留による、医療画像の統一的セグメンテーション・分類・検出
arXiv cs.CV / 2026/5/5
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、複数の異質な医療画像データセットから知識を活用して、セグメンテーション・分類・物体検出をまとめて高性能化する統一的なクロスドメイン移転学習フレームワークを提案する。
- 教師–生徒パラダイムを採用し、共同の教師モデルが多様なソースから学習したドメイン不変表現を集約し、生徒モデルはマルチレベルの知識蒸留によってタスク別に学習する。
- 手法は当初セグメンテーション向けに開発されていたが、画像レベルの分類とバウンディングボックスに基づく検出を扱えるよう拡張され、医療画像解析のための汎用マルチタスク化が実現されている。
- MRI/CTを含む幅広いデータセット(6つのセグメンテーションベンチマーク、BrainMetShare、ISLES、BraTS、Lung MSD、LiTS、KiTS など)と、肺疾患・認知症の分類データ、ネイティブなバウンディングボックス注釈を持つ検出データで検証し、いずれでも強力なベースラインに対して一貫した改善が示された。
- 分布のずれへの頑健性と異種医療ドメインへの汎化性能が向上することから、多タスク・非タスク依存に近い蒸留アプローチとしてスケーラブルな可能性が示唆される。




