証拠(Evidential)変換ネットワーク:事後(ポストホック)の不確実性推定のために、学習済みモデルを証拠モデルへ変換する
arXiv cs.AI / 2026/4/13
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、標準的な事前学習済みの視覚/言語モデルは、信頼できる配備可能な信頼度(confidence)推定を欠いていることが多く、深いアンサンブルやMC dropoutといった一般的な不確実性手法は実運用上のコストが高くなりがちだと述べている。
- 学習済みの基盤ネットワークを最初から再学習し直すことなく、既存の事前学習済み予測器を証拠(evidential)モデルへ変換する軽量な事後(ポストホック)モジュールであるEvidential Transformation Network(ETN)を提案する。
- ETNはログitのサンプル依存のアフィン変換を学習し、変換後の出力をディリクレ分布(Dirichlet)のパラメータとして扱うことで、証拠に基づく不確実性推定を生成する。
- 画像分類およびLLMの質問応答ベンチマークでの実験により、ETNは分布内(in-distribution)および分布外(out-of-distribution)の両方の状況で不確実性推定を改善しつつ、予測精度を損なわず、計算オーバーヘッドも最小限に抑えられることが示される。




