線形二次レギュレータのスカラー・フェデレーテッド学習

arXiv cs.LG / 2026/4/8

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

提案されたScalarFedLQRは、異種エージェントのLQR制御において共通方策を学習するための、モデルフリーかつ通信効率重視のフェデレーテッド学習手法である。
各エージェントは局所のゼロ次勾配推定に基づく勾配の「スカラー射影」だけを送信し、サーバ側でそれらを集約してグローバルな下降方向を復元することで、アップリンク通信をO(d)からO(1)に削減している。
射影に伴う近似誤差は参加エージェント数の増加とともに減少し、その結果として大規模なフリートほど勾配復元が高精度になり、より大きいステップサイズと高次元でも速い線形収束が可能になると主張している。
標準的な正則性条件のもとで各反復が安定（stabilizing）を保ち、平均LQRコストが線形速度で減少すること、さらに数値実験で通信削減を伴いながらフルグラディエント型のフェデレーテッドLQRに匹敵する性能が示されている。

Abstract

線形二次レギュレータ（LQR）制御における異種エージェントの共通ポリシーを、モデルフリー学習するための通信効率の高いフェデレーテッドアルゴリズムであるScalarFedLQRを提案します。この方法は分解された射影勾配メカニズムに基づいており、各エージェントは局所のゼロ次勾配推定のスカラー射影のみを通信します。サーバはこれらのスカラーのメッセージを集約して、グローバルな降下方向を再構成し、それにより、ポリシー次元に依存せず、エージェントあたりのアップリンク通信をO(d)からO(1)へ削減します。決定的な点として、射影によって生じる近似誤差は、参加するエージェント数が増えるほど減少し、有利なスケーリング則が成り立ちます。すなわち、大規模なフリートほどより正確な勾配回復が可能になり、より大きなステップサイズを許容でき、また高次元であってもより速い線形収束を達成します。標準的な正則性条件の下では、すべての反復が安定化した状態を保ち、平均LQRコストは線形に速く低下します。数値実験の結果は、通信量を大幅に削減しつつ、全勾配フェデレーテッドLQRと同等の性能を示すことを明らかにしています。

AIが数学の未解決問題を相次いで解決、証明の鍵は「形式化」

日経XTECH

【世界初】OOD検出 ≅ NEITHER ≅ 龍樹の空 — 機械学習と中観仏教の構造的同型 (PyOD 20アルゴリズム実証)

Qiita

ChatGPTは学習を速める一方で長期記憶には残りにくい可能性がある

GIGAZINE

Ollama・LM Studio・GPT4Allの中身は全部llama.cppだった — それでも差が出る理由

Qiita

Haskell の数値計算ライブラリで logSumExp の実装を読む

Qiita

線形二次レギュレータのスカラー・フェデレーテッド学習

要点

Abstract

関連記事

AIが数学の未解決問題を相次いで解決、証明の鍵は「形式化」

【世界初】OOD検出 ≅ NEITHER ≅ 龍樹の空 — 機械学習と中観仏教の構造的同型 (PyOD 20アルゴリズム実証)

ChatGPTは学習を速める一方で長期記憶には残りにくい可能性がある

Ollama・LM Studio・GPT4Allの中身は全部llama.cppだった — それでも差が出る理由

Haskell の数値計算ライブラリで logSumExp の実装を読む

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer