要旨:分散強化学習ポリシーは、エッジデバイスとクラウドサーバへ展開される際に、ネットワーク遅延、ジッター、パケット損失に直面します。標準的なRLトレーニングは遅延ゼロの相互作用を前提としており、現実的なネットワーク条件下で深刻な性能低下を引き起こします。私たちはCALF(Communication-Aware Learning Framework)を導入します。これはシミュレーション中に現実的なネットワークモデルの下でポリシーを学習します。系統的な実験により、ネットワークを意識したトレーニングが、ネットワークに依存しないベースラインと比較してデプロイ時の性能ギャップを大幅に縮小することが示されています。異種ハードウェアにまたがる分散ポリシーのデプロイメントは、トレーニング中に通信制約を明示的にモデリングすることが、実世界での堅牢な実行を可能にすることを検証します。これらの知見は、Wi-Fiに類似した分散デプロイメントにおけるシムツーリアル転送の主要軸としてネットワーク条件を位置づけ、物理モデリングと視覚的ドメイン乱数化を補完します。
CALF: 通信を意識した分散強化学習の学習フレームワーク
arXiv cs.AI / 2026/3/16
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- CALF は、分散デプロイメントにおける遅延・ジッター・パケット損失に対処するため、現実的なネットワークモデルを用いてシミュレーション中に強化学習ポリシーを訓練します。
- このフレームワークは、通信制約を明示的にモデリングすることが実世界でのデプロイメント性能を向上させ、Wi-Fiに類似したネットワークにおけるシミュレーションと現実のギャップを縮小することを示しています。
- 異種ハードウェアに跨る実証的結果は、ネットワークを意識した訓練が、変動するネットワーク条件下で、ネットワーク非依存のベースラインと比較して堅牢な性能を発揮することを示しています。
- CALF は、物理ベースの手法や視覚的ドメイン乱数化など、既存のシム-toリアル戦略を補完し、ネットワーク条件を主要な転移軸として扱います。
- 本研究は、エッジ-クラウド環境における堅牢な分散RLの重要な軸としてネットワーク条件を強調し、実際のデプロイメントへの広範な示唆を与えます。
関連記事

【AIニュース】SBGなど、米で80兆円データセンター計画【日経新聞、読売新聞】
note
「Google AI Studio」がFirebaseのバックエンドとAntigravityのコーディングエージェントを搭載、プロンプトだけで高度なフルスタックアプリケーションを生成可能に
Publickey
AIエージェントがコマンドラインでブラウザを自動操作できる「Browser Use CLI 2.0」リリース。Chrome DevToolsへの接続などで操作速度が2倍に
Publickey
エッジコンピューティングとローカル処理への大規模な移行
Dev.to
仕様駆動開発における自己改良エージェント
Dev.to