検出—抽出ギャップ：モデルは言う前に答えを知っている

arXiv cs.CL / 2026/4/9

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は「検出—抽出ギャップ」を見出しており、推論モデルは正しい答えが早い接頭辞からすでに復元可能であるにもかかわらず、相当量のチェーン・オブ・ソートを生成してしまう（CoTトークンの52〜88%がコミット後に生成される）。
自由継続デコーディングでは、トレースのわずか10%程度からでも正しい答えを復元できる一方で、強制抽出は42%のケースで失敗する。これは、モデル状態には答えが含まれているにもかかわらず、デコーディングの選択が復元を妨げていることを示唆する。
著者らはこの不一致を形式化し、自由継続と強制継続の分布間の全変動距離を上界で示すことで、接尾辞がどのように分布をシフトさせるかを定量化する。
ギャップに対処するため、本論文はBlack-box Adaptive Early Exit（BAEE）を提案する。検出と抽出の両方に自由継続を用いて逐次生成を70〜78%切り詰め、検証したモデルとベンチマークにわたり精度を1〜5ポイント改善する。
「thinking-mode」モデルでは、早期離脱によってコミット後の上書きを回避でき、最大5.8ppの向上が得られる。さらにコスト最適化版ではAPI呼び出しを（68〜73%削減）しつつ、中央値で9回の呼び出しに抑える。コードはGitHubで公開されている。

要旨: 現代の推論モデルは、答えがすでに決定された後もなお長く生成を続けます。5つのモデル構成、2つの系列、3つのベンチマークにわたって調査したところ、 extbf{連鎖思考（chain-of-thought）トークンの52--88%が、部分的なプレフィックスから答えが復元可能であるのに生成されている}ことを見いだしました。このポストコミットメント生成は構造的な現象を明らかにします。それが extbf{検出--抽出ギャップ（detection--extraction gap）}です。初期プレフィックスからの自由な継続（free continuations）では、トレースの10%においても正しい答えが回復されますが、強制抽出（forced extraction）はこれらの42%のケースで失敗します。答えはモデル状態から復元可能なのに、プロンプト条件付きのデコーディングではそれを抽出できません。この不一致を、自由継続分布と強制継続分布の全変動（total-variation）に基づく上界として形式化し、サフィックスが引き起こすシフトを定量的に見積もります。この非対称性を活用して、ブラックボックス適応型アーリーイグジット（Black-box Adaptive Early Exit、\BAEE{}）を提案します。これは検出と抽出の両方に自由な継続を用い、 extbf{直列生成の70--78%を切り詰め}つつ、 extbf{すべてのモデルで精度を1--5pp向上}させます。思考モードのモデルでは、アーリーイグジットによりポストコミットメントの上書きが防がれ、最大5.8ppの利得が得られます。コスト最適化版では、API呼び出しの中央値が9回のところで、68--73%の削減を達成します。コードは https://github.com/EdWangLoDaSc/know2say で公開されています。
返却形式: {"translated": "翻訳されたHTML"}

💡 この記事が使われたインサイト

AIの最新ニュースをまとめた「今日の要点」で、この記事が取り上げられています。

📅 4/9Dailyインサイトを見る →

Black Hat Asia

AI Business

テスラの巨大AI半導体工場、インテル参画テラファブ「製造技術を刷新」

日経XTECH

エプソン、インクジェットで半導体製造ラピダスに出資「連携深める」

日経XTECH

データサイエンティストの役割 AIで変わる、分析から「価値創造」へ

日経XTECH

ベイシアグループが横断ハッカソン、業務時間の5％を他事業へ割り当て

日経XTECH

検出—抽出ギャップ：モデルは言う前に答えを知っている

要点

💡 この記事が使われたインサイト

関連記事

Black Hat Asia

テスラの巨大AI半導体工場、インテル参画テラファブ「製造技術を刷新」

エプソン、インクジェットで半導体製造ラピダスに出資「連携深める」

データサイエンティストの役割 AIで変わる、分析から「価値創造」へ

ベイシアグループが横断ハッカソン、業務時間の5％を他事業へ割り当て

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

💡 この記事が使われたインサイト

関連記事

Black Hat Asia

テスラの巨大AI半導体工場、インテル参画 テラファブ「製造技術を刷新」

エプソン、インクジェットで半導体製造 ラピダスに出資「連携深める」

データサイエンティストの役割 AIで変わる、分析から「価値創造」へ

ベイシアグループが横断ハッカソン、業務時間の5％を他事業へ割り当て

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

テスラの巨大AI半導体工場、インテル参画テラファブ「製造技術を刷新」

エプソン、インクジェットで半導体製造ラピダスに出資「連携深める」