知識蒸留は失うものを考慮しなければならない
arXiv cs.LG / 2026/4/29
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- この論文は、知識蒸留の評価はタスク精度だけでなく、信頼できる結果を生む教師の能力が学生モデルにどの程度保持されているかも確認すべきだと主張しています。
- 見出しとなる指標に依存すると、不確実性推定、境界挙動、プロセスの信頼性、オンポリシー安定性、グラウンディング、プライバシー、安全性、多様性といった領域での蒸留損失が見えなくなると警告しています。
- 著者らは蒸留を、教師の行動の「忠実なコピー」ではなく「損失を伴う射影(ロッシーなプロジェクション)」として捉え直し、従来評価にある「保持(retention)の仮定」を示しています。
- 既存の証拠をもとに、オフメトリック(スコア外)の蒸留損失の分類(タクソノミー)を整理し、これらの問題が具体的で反復的かつ測定可能であることを示しています。
- シナリオ別の保持目標と、「Distillation Loss Statement(蒸留損失声明)」を提案し、保持できたもの・失ったもの・残る損失が許容される理由を透明に報告することを目指しています。



