より悪化しない文脈に配慮したデコーディング:文脈条件付き生成におけるニュートラル・レグレッションの防止

arXiv cs.CL / 2026/4/21

📰 ニュースModels & Research

要点

  • 本稿は、非有益な外部文脈が与えられたときにLLMが正しい回答を上書きしてしまう「ニュートラル・レグレッション」を扱い、それを“害を与えない”要件として形式化する。
  • ニュートラル性は、答えに整合的な(しかし役に立たない)文脈下での、ベースラインで正しかった項目の精度低下を測ることで評価する。
  • 提案手法No-Worse Context-Aware Decoding(NWCAD)は、2ストリーム構成と2段階ゲートにより判断して使い分ける、デコード時アダプタである。
  • 文脈が非情報的だと判断された場合は文脈なしデコーディングへ後退し、有益そうな場合は不確実性下でCAD-styleのフォールバックを伴う文脈条件付きデコーディングを用いる。
  • do-no-harmの信頼性と文脈活用を切り分けたベンチマークで、NWCADはニュートラル・レグレッションを防ぎつつ、有益な文脈での精度向上を維持することを示す。

Abstract

大規模言語モデル(LLM)は、外部の文脈(例:検索された根拠)に条件付けられることで、質問に答えたり文書を要約したりできますが、文脈の利用はなお不確実です。文脈が有益な情報を含まない場合でも、モデルはすでに正しい出力を上書きしてしまうことがあります(中立的回帰)。本稿では、この中立的回帰を「害を与えないこと(do-no-harm)」という要件として形式化し、回答が文脈と整合している状況での文脈付き条件において、ベースラインで正解の項目に対する精度の低下を測定することで定量化します。そこで、No-Worse Context-Aware Decoding(NWCAD)を提案します。これは、二つのストリーム構成に基づくデコード時アダプタであり、二段階のゲートを備えています。文脈が非情報的であるときは文脈なしデコードへ後退し、そうでない場合は不確実性のもとでCAD型のフォールバックを伴う、文脈条件付きデコードを用います。私たちは、害を与えない信頼性と文脈の利用(本当に有益な文脈に対する精度向上)を切り分けるベンチマークでNWCADを評価します。NWCADは、ベースラインで正解の項目における中立的回帰を防ぎつつ、有益な文脈に対する強力な文脈駆動の精度を維持します。