分散データセンターにおける共同エネルギー管理と連携AIGCワークロードスケジューリング:拡散支援型報酬シェーピング手法

arXiv cs.LG / 2026/5/6

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、コンテンツ生成の品質を落とさずにデータセンターのエネルギーコストを削減するため、分散データセンターにおけるAIGCワークロードをASP間で連携させてスケジューリングする共同フレームワークを提案している。
  • サービス品質を明示的に数理化することで、ASP間でのジョブ転送や、推論プロセスのきめ細かな制御を可能にし、さらに複数のエネルギー資源を同時に扱って電力の柔軟性を高めている。
  • AIGCサービスの売上と運用ペナルティおよびコストの間のバランスを取るため、システム効用の最大化問題として定式化している。
  • スケジューリング意思決定の強い結合により報酬が疎になり、既存の深層強化学習(DRL)の有効性が制限される点に対し、多段のノイズ除去によって補完的な報酬信号を合成する「拡散モデル支援型報酬シェーピング」を開発している。
  • 実世界のモデルとデータセットに基づく実験では、電力価格の変動やASP間のAIGCモデルの異種性に対する頑健性を含め、学習収束の改善とベンチマークより高いシステム効用が示されている。

Abstract

人工知能生成コンテンツ(AIGC)は、多様でカスタマイズされたコンテンツの作成を自動化するための変革的パラダイムとして登場し、クラウドデータセンターにおける計算負荷が急速に増大している。AIGCサービス提供者(ASP)が、データセンターのエネルギーコストを削減しつつ高品質なコンテンツ生成を保証するために、AIGCワークロードを戦略的にスケジューリングすることが不可欠である。しかし、AIGCサービスの特有の特徴は、ASP間でのモデルの異質性、サービス品質の暗黙的な評価、複雑な推論プロセス制御といった重要な課題をもたらす。これらの課題に対処するために、我々は、サービス品質を明示的に数学的に特徴づけることを導入し、ASP間のジョブ転送ときめ細かな推論プロセス設定の両方を促進する、共同のエネルギーマネジメントおよび連携AIGCワークロードスケジューリングの枠組みを提案する。さらに、データセンター内のさまざまなエネルギー資源を共同で考慮し、電力利用の柔軟性を高める。続いて、AIGCサービスの収益と、運用上のペナルティおよびコストとのバランスを取るためのシステム効用最大化問題を定式化する。それにもかかわらず、ジョブスケジューリングの意思決定間の強い結合により、報酬が極めて疎になってしまい、既存の深層強化学習(DRL)アルゴリズムの有効性が制限される。この問題に対処するために、多段階のデノイズ(消去)プロセスを通じて補完的な報酬信号を合成する、拡散モデル支援型の報酬整形アプローチを開発する。このアプローチはDRLにシームレスに統合され、疎な環境フィードバックの下でスケジューリング方策を効率的に学習できるようにする。実世界のモデルおよびデータセットに基づく実験により、提案手法は電力価格の変動とAIGCモデルの異質性に対して効果的に対応できること、またベンチマーク手法と比較して優れた学習収束とシステム効用を達成できることが示される。