推測デコードのスケーリング則（SDSL）：スループット最適化をシンプルに

arXiv cs.CL / 2026/3/13

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

共有:

要点

推測的デコードは、推論を加速しスループットを向上させるために複数の言語モデルを用います。
本論文は、従来のスループット最適化がLLMの訓練に結びついた高コストな実験的アプローチに依存していたことを指摘しています。
下流の SD（Speculative Decoding）ベース推論システムのスループット効率と、事前学習済みLLMの主要なハイパーパラメータを分析的につなぐ理論を提案します。
この理論は、事前訓練前にスループット最適なハイパーパラメータを予測できるようにし、モデルとシステム設計の指針を提供します。

本文: arXiv:2603.11053v1 告知タイプ: 新着要旨：推測的デコードは、推論を加速させるために複数の言語モデルを用いる技術です。従来の研究は、推論パイプラインのスループットを最適化するために実験的アプローチを用いており、これはLLMの訓練を伴い、費用がかかることがあります。推測的デコードの本研究は、事前学習済みLLMの主要なハイパーパラメータを、下流の SD（Speculative Decoding）ベースの推論システムのスループット効率と分析的につなぐ理論を提案します。この理論は、推論システムの構成要素のための、事前訓練前にスループット最適なハイパーパラメータを予測できるようにします。

テクノロジー「AI警告危険人物」

note

裏カツ164日目！アメリア#AIイラスト #画像生成AI #アート #イラスト #生成AI #美女イラスト #創作 #クリエイター #イラストレーター

note

ぽんず｜管理職のAI仕事術

note

AIに丸投げしたら「自分の言葉」が消えた40代管理職の話

note

#2 : プロンプト研究講座【第18回】複数キャラクターの関係性の描き方

note

推測デコードのスケーリング則（SDSL）：スループット最適化をシンプルに

要点

関連記事

テクノロジー「AI警告危険人物」

裏カツ164日目！アメリア#AIイラスト #画像生成AI #アート #イラスト #生成AI #美女イラスト #創作 #クリエイター #イラストレーター

ぽんず｜管理職のAI仕事術

AIに丸投げしたら「自分の言葉」が消えた40代管理職の話

#2 : プロンプト研究講座【第18回】複数キャラクターの関係性の描き方

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer