一度設計して、大規模に展開：大規模モデル・エコシステムのためのテンプレート駆動型ML開発

arXiv cs.AI / 2026/3/27

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は計算広告におけるレコメンデーション・システムについて、大規模な実証研究を報告しており、多数のMLモデルから成るエコシステムを効率的に管理する方法に焦点を当てている。
異なるデータ分布や最適化イベントに適応できるようにするため、標準モデル・テンプレート（SMT）を提案し、標準化された合成可能なMLコンポーネントを用いる。
SMTにより、各モデルを個別に最適化するためのレイテンシとエンジニアリング負担に対処しつつ、ML手法の伝播に伴う複雑性を O(n·2^k) から O(n+k) に削減できると主張している。
Metaの広告ランキング・エコシステムにおいて、4つのグローバルな開発サイクルを通じてSMTを適用した結果、平均で交差エントロピーが0.63%改善し、モデルごとの反復に要するエンジニアリング時間が92%削減され、手法からモデルへの採用スループットが6.3倍に増加した。
これらの結果は、異なる最適化目的が必ずしも各ケースごとにモデル設計を完全に多様化することを要する、という考え方に挑戦するものである。

要旨: 現代の計算広告プラットフォームは通常、クリック率、コンバージョン率、その他の最適化イベントといったユーザーの反応を予測するために、レコメンデーションシステムに依存しています。多種多様なプロダクトの表面（プロダクトサーフェス）や広告主の目標に対応するため、これらのプラットフォームはしばしば膨大な数の機械学習（ML）モデルからなるエコシステムを維持しています。しかし、この規模で運用することは、重大な開発および効率上の課題を生み出します。MLモデルを定期的に更新し、新たな手法をエコシステムへ伝播させるには多大なエンジニアリング努力が必要となり、その結果、MLイノベーションをエコシステム全体に展開する際に長いレイテンシが発生します。
本研究では、レコメンデーションシステムにおいて、標準化されたモデル構築アプローチと、モデルごとに独立して行う最適化との間で、モデル性能、効率、そしてML手法の伝播を大規模に実証的に比較します。これを標準化のために、Standard Model Template（SMT）――高性能なモデルを生成し、多様なデータ分布や最適化イベントに適応可能にする枠組み――を提案します。標準化された、組み合わせ可能なMLモデル構成要素を利用することで、SMTは手法伝播の複雑性を $O(n \cdot 2^k)$ から $O(n + k)$ へと低減します。ここで $n$ はモデル数、 $k$ は手法数です。
Metaのプロダクション広告ランキングのエコシステム内で、4つのグローバルな開発サイクルにわたって広範なモデル群を評価した結果、次が示されました: (1) 中立的な配信容量における交差エントロピーの平均で0.63%の改善、(2) モデルごとの反復のためのエンジニアリング時間を92%削減、(3) 手法とモデルのペアの採用スループットを $6.3\times$ 向上。これらの知見は、多様な最適化目標がそれ自体、必然的に多様なMLモデル設計を必要とするという従来の常識に挑戦します。