アンカー付きコンファブレーション：部分的な証拠がLLMの確信度の高い幻覚を非単調に増幅する

arXiv cs.CL / 2026/4/30

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsIdeas & Deep AnalysisTools & Practical UsageModels & Research

共有:

要点

本論文は、LLMにおいて単一の確認済み中間事実を与えると、その後に完全な証拠で誤りが解消される前に「確信度の高い誤答率」が一時的に上がる新たなキャリブレーション特性を見いだし、「アンカー付きコンファブレーション」と呼んでいます。
著者らはこの現象を Parametric Hallucination Confidence（PHC）として定式化し、因果注入実験や複数モデル系列でのスケーリング結果など、6系統の証拠にわたって検証しています。
提案された「Anchoring Threshold Law」は、推論のホップ深さに応じてPHC増幅がどう大きくなるかを予測し、複数の中間予測が確認された場合に観測される効果を示しています。
応用として、RAGルーティングにおいてPHCを活用する LearnedRouter を提案し、モデルのファインチューニングなしで、オラクル性能ギャップを大きく縮小できることを、4つのベンチマーク・1,800クエリで示します。
対策として、「認識上の謙虚さ」を促すプロンプトや明示的な自己評価がPHCスパイクを抑えることを示し、ルーティング指標としては語彙的な自信よりも自己評価が優れると報告しています。