オープンセット・テキスト分類システムにおける不確実性推定
arXiv cs.AI / 2026/4/13
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、入力を既知クラスに割り当てるか未知として拒否する必要があるオープンセット・テキスト分類(OSTC)を対象とし、正確な不確実性推定の重要性を強調している。
- Holistic Uncertainty Estimation(HolUE)アプローチをテキスト領域に適応し、2つの異なる誤り要因をモデル化する:不適切に定式化されたクエリによるテキスト不確実性、曖昧なデータ分布によるギャラリー不確実性である。
- これらの不確実性成分を捉えることで、分類器が認識ミスを起こしそうな状況を予測し、それに応じて拒否(rejection)を発動することを目指す。
- 著者らは新しいOSTCベンチマークを導入し、著者推定、意図分類、トピック分類のデータセットにわたって大規模な実験を行っている。
- 実験結果より、HolUEは品質ベースのSCFベースラインに比べてPrediction Rejection Ratio(PRR)を大幅に改善することが示される(例:Yahoo Answersで最大365%)。また、コード/プロトコルは公開されている。



