概要: レコメンデーションのスケーリング則における近年の進歩により、前例のない複雑さを持つ基盤モデルが登場しました。これらのモデルは優れた性能を提供する一方で、その計算コストが現実時間での提供を非現実的にしがちで、多くの場合、効率のために知識蒸留による妥協(提供品質の低下)に頼らざるを得なくなっています。この課題に対処するため、推測デコーディングに着想を得た新しい枠組みSOLARIS(推測的オフロード:推論スケーリングのための潜在表現に基づく)を提案します。SOLARISは、将来の要求に登場しそうなユーザとアイテムの組を予測することで、ユーザ-アイテム間の相互作用埋め込みを事前に先回りして計算し、基盤モデルの表現を非同期に先行生成します。この手法により、高コストな基盤モデル推論を、レイテンシに厳しい提供(サービング)経路から切り離すことができ、オンライン利用には高すぎると考えられていたモデルからのリアルタイムな知識転移を可能にします。Metaの広告システムにおいて、1日あたり数十億件のリクエストにわたって展開されたSOLARISは、売上を押し上げるトップライン指標で0.67%の向上を達成しており、大規模環境での有効性を示しています。
SOLARIS:推論スケーリングのための潜在ベース表現の推測的オフロード
arXiv cs.LG / 2026/4/15
📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- SOLARISは、推測的デコーディングの考え方を用いて、実時間で要求される前に起こりそうなユーザ—アイテム対のための潜在表現を事前計算する、推論スケーリングのための提案フレームワークである。
- 基盤モデルの埋め込みを非同期に事前生成することで、SOLARISは高コストなモデル推論を、レイテンシが厳しく要求されるオンライン配信経路から切り離し、知識蒸留に基づく品質面での妥協の必要性を減らす。
- この手法は、どのユーザ—アイテムの相互作用が起こるかを予測し、その対応する基盤モデル表現を先回りして計算することで、オンライン配信が事前計算済みの出力に依存できるようにする。
- 論文ではMetaの広告システムでの導入が報告されており、1日数十億件のリクエストを処理し、売上に寄与するトップライン指標で0.67%の増加を観測している。
- 全体としてSOLARISは、「オンラインでは配信コストが高すぎる」モデルを、蒸留によってモデルを圧縮することだけに頼らず、途中表現の推測的オフロードによって実現可能なものへと再定義する。




