SpecTr-GBV:複数ドラフトによるブロック検証が推論のスペキュレイティブ・デコーディングを加速

arXiv cs.CL / 2026/4/30

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • SpecTr-GBVは、マルチドラフト戦略とグリーディなブロック検証(GBV)を単一の枠組みに統合した新しいスペキュレイティブ・デコーディング手法であり、従来のように別々の改善として扱いません。
  • 検証ステップを、ドラフトトークンブロックとターゲットトークンブロック間のオプティマル・トランスポート問題として定式化し、理論面と実運用面の双方で効率の向上を狙います。
  • 著者らは、i.i.d.なドラフト生成の前提のもとでSpecTr-GBVが達成可能な最適な期待受理長に到達することを理論的に証明し、ドラフト数が増えるほどこの上界が改善することも示しています。
  • 5つのデータセットで4つのベースラインと比較した結果、出力品質を維持しつつ、速度向上とブロック効率のいずれも高い性能を示し、さらにアブレーション研究で重要なハイパーパラメータの影響を評価しています。