要旨: 現代の推論モデルは、答えがすでに決定された後もなお長く生成を続けます。5つのモデル構成、2つの系列、3つのベンチマークにわたって調査したところ、 extbf{連鎖思考(chain-of-thought)トークンの52--88%が、部分的なプレフィックスから答えが復元可能であるのに生成されている}ことを見いだしました。このポストコミットメント生成は構造的な現象を明らかにします。それが extbf{検出--抽出ギャップ(detection--extraction gap)}です。初期プレフィックスからの自由な継続(free continuations)では、トレースの10%においても正しい答えが回復されますが、強制抽出(forced extraction)はこれらの42%のケースで失敗します。答えはモデル状態から復元可能なのに、プロンプト条件付きのデコーディングではそれを抽出できません。この不一致を、自由継続分布と強制継続分布の全変動(total-variation)に基づく上界として形式化し、サフィックスが引き起こすシフトを定量的に見積もります。この非対称性を活用して、ブラックボックス適応型アーリーイグジット(Black-box Adaptive Early Exit、\BAEE{})を提案します。これは検出と抽出の両方に自由な継続を用い、 extbf{直列生成の70--78%を切り詰め}つつ、 extbf{すべてのモデルで精度を1--5pp向上}させます。思考モードのモデルでは、アーリーイグジットによりポストコミットメントの上書きが防がれ、最大5.8ppの利得が得られます。コスト最適化版では、API呼び出しの中央値が9回のところで、68--73%の削減を達成します。コードは https://github.com/EdWangLoDaSc/know2say で公開されています。
返却形式: {"translated": "翻訳されたHTML"}
検出—抽出ギャップ:モデルは言う前に答えを知っている
arXiv cs.CL / 2026/4/9
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は「検出—抽出ギャップ」を見出しており、推論モデルは正しい答えが早い接頭辞からすでに復元可能であるにもかかわらず、相当量のチェーン・オブ・ソートを生成してしまう(CoTトークンの52〜88%がコミット後に生成される)。
- 自由継続デコーディングでは、トレースのわずか10%程度からでも正しい答えを復元できる一方で、強制抽出は42%のケースで失敗する。これは、モデル状態には答えが含まれているにもかかわらず、デコーディングの選択が復元を妨げていることを示唆する。
- 著者らはこの不一致を形式化し、自由継続と強制継続の分布間の全変動距離を上界で示すことで、接尾辞がどのように分布をシフトさせるかを定量化する。
- ギャップに対処するため、本論文はBlack-box Adaptive Early Exit(BAEE)を提案する。検出と抽出の両方に自由継続を用いて逐次生成を70〜78%切り詰め、検証したモデルとベンチマークにわたり精度を1〜5ポイント改善する。
- 「thinking-mode」モデルでは、早期離脱によってコミット後の上書きを回避でき、最大5.8ppの向上が得られる。さらにコスト最適化版ではAPI呼び出しを(68〜73%削減)しつつ、中央値で9回の呼び出しに抑える。コードはGitHubで公開されている。



