同値損失による不確実性サンプリングの理解
arXiv stat.ML / 2026/4/8
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文はアクティブラーニングにおける不確実性サンプリングを再検討し、その一般的な実践は「不確実性」に関して損失と整合する定義が合意されていないため、主としてヒューリスティックであると主張する。
- そこで、「同値損失(equivalent loss)」という枠組みを導入し、選択した不確実性尺度を元のタスク損失に結び付けることで、不確実性サンプリングがこの導出された目的を実効的に最適化していることを示す。
- 著者らは、既存の不確実性尺度を2つの性質――サロゲート性質および損失の凸性――によって検証し、これらの尺度が基礎となる学習目標と理論的にどの条件下で良く整合しているのかを明確化する。
- 凸性が保たれる場合、本論文は同値損失に関するサンプル複雑度の結果を提示し、それをサロゲートな連結により二値損失の保証へと変換する。
- さらに、本論文は穏やかな条件のもとで、不確実性サンプリングが受動学習に対して漸近的に優れていることを証明し、プールベース、マルチクラス、回帰設定への拡張の可能性を概説する。
