HTDC: 大規模視覚言語モデルにおける幻覚を抑制するための、ためらいに基づく差分キャリブレーション
arXiv cs.CV / 2026/4/15
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、大規模視覚言語モデルにおける幻覚が、不安定な視覚的グラウンディングと、言語プリアの過度な依存の組み合わせによって生じ得ることを特定している。
- 訓練不要のデコード手法として、Hesitation-Triggered Differential Calibration(HTDC)を提案し、キャリブレーションを毎トークンではなく、層ごとの「ためらい(hesitation)」ステップのみに適用する。
- ためらいの信号は、中間層におけるトークン嗜好の揺らぎから導出され、グラウンディングの不安定性を検出するために用いられる。
- ためらいが発火したとき、HTDCは、標準的なフルブランチ推論を2つの軽量プローブ(視覚ヌリフィケーションとセマンティックヌリフィケーション)と比較し、幻覚を誘発しやすい候補を抑制する。
- 幻覚ベンチマークでの実験により、HTDCはタスク精度を維持しつつ幻覚を低減し、各ステップでのキャリブレーションと比べて計算量も削減できることが示されている。




