DIVERSED:動的アンサンブル検証によるリラックスした推測的デコーディング
arXiv cs.CL / 2026/4/10
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- DIVERSED(Dynamic Verification Relaxed Speculative Decoding)は、従来のspeculative decodingが持つ「厳密な検証(受理分布の厳格一致)」のボトルネックを緩和して推論速度を高める手法を提案しています。
- ドラフト(draft)とターゲット(target)モデルの分布を、タスクや文脈に応じて重み付けする“アンサンブル検証器”で統合し、もっと多くの妥当なトークンを受理できるようにします。
- 理論的な根拠を提示しつつ、実験により標準的なspeculative decodingよりも大幅に高い推論効率(time efficiency)と生成品質の維持を示したとされています。
- コードはGitHub(comeusr/diversed)で公開されており、手法の再現・検証が可能です。


