トークンからステップへ:効率的なマルチステップ推論のための検証対応スペキュレイティブデコーディング
arXiv cs.CL / 2026/4/17
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- この論文は、誤ったステップが連鎖して広がるのを防ぎつつマルチステップ推論を改善する検証対応のスペキュレイティブデコーディング手法としてSpecGuardを提案しています。
- 外部のリワードモデルに頼らず、SpecGuardはモデル内部の信号だけでステップ単位の検証を行います。
- 各ステップで複数のドラフト候補をサンプリングし、最も整合的なステップを選んだうえで、承認するかターゲットで再計算するかを(注意に基づくグラウンディングスコアと、トークンの対数確率に基づく信頼度の2つの)軽量な内部スコアで判断します。
- 複数の推論ベンチマークで、精度が3.6%向上し、標準的なスペキュレイティブデコーディングおよびリワード誘導型を上回ってレイテンシが約11%低減したと報告されています。
- 全体としてSpecGuardは、検証信号に基づいて計算を選択的に割り当てることで、より効率的かつ汎用性の高い推論を狙っています。



