概要: 姿勢制御は、多くの衛星ミッションにとって不可欠です。しかし、従来型の制御器は設計に時間がかかるうえ、モデルの不確実性や運用上の境界条件の変動に対して敏感です。深層強化学習(DRL)は、シミュレーション環境との自律的な相互作用を通じて適応的な制御戦略を学習することで、有望な代替手段を提供します。シミュレーションで訓練したエージェントを実際の物理的な衛星に展開する「Sim2Realギャップ」を克服することは、依然として大きな課題です。本研究では、慣性指向姿勢の操舵に対するAIベースの姿勢制御器について、軌道上で初めて成功した実証を提示します。制御器はシミュレーションのみで完全に訓練され、ジュリウス・マキシミリアン大学ヴュルツブルク校がテクニッシェ・ユニヴェルジテート・ベルリンと協力して開発し、2025年1月に打ち上げられたInnoCube 3Uナノサテライトに搭載されました。AIエージェントの設計、訓練手順の方法論、シミュレーションと実機衛星で観測された挙動の相違、そしてAIベースの姿勢制御器とInnoCubeの従来型PD制御器との比較を示します。定常状態の指標は、反復的な軌道上操舵においてAIベース制御器が堅牢に性能を発揮することを確認しています。
LeLaR:AIベースの衛星姿勢制御器による初の軌道上実証
arXiv cs.RO / 2026/4/1
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、シミュレーションのみで学習した深層強化学習を用いるAIベースの衛星姿勢制御器について、軌道上で初めて成功裏に実証したLeLaRを報告する。
- この制御器は2025年1月に打ち上げられたInnoCube 3Uナノサテライトに搭載され、反復的な軌道上テストを通じて慣性指向の操舵(慣性指向マニューバ)を可能にした。
- 著者らは、AIエージェントの設計、学習手法、およびシミュレーション環境と衛星の観測挙動の間に生じる不一致への対処方法を詳述しており(Sim2Realギャップへの対応)、それにより実環境での動作を実現した。
- 結果は衛星の従来型PD制御器と比較され、定常状態の指標は、反復的な操舵の下でも堅牢な性能を示している。




