なぜ知らないの？不確実性の発生源がLLMにおける不確実性定量化（UQ）へ与える影響を評価する

arXiv cs.CL / 2026/4/14

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、LLMが現実の安全性が重要な環境へ投入されていくに伴い、信頼できる不確実性定量化（UQ）が不可欠であると主張している。
言語タスクにおける不確実性は、知識の不足、出力のばらつき、入力の曖昧さなど、複数の発生源から生じ、それぞれがシステムの挙動に異なる影響を与えることを示している。
著者らは、どの不確実性の発生源が存在するかによって、既存のUQ手法の性能と信頼性がどのように変化するかを調べる。
不確実性の発生源を明示的にラベル付け／分類する新しいデータセットを導入し、制御された体系的な評価を可能にする。
実験結果から、多くのUQ手法はモデルの知識に起因する不確実性の範囲では良好に機能する一方で、他の不確実性の発生源が関与すると劣化したり、誤解を招く挙動を示したりすることが明らかになり、不確実性の発生源を意識したUQアプローチの必要性が示唆される。