モバイル自律システムにおけるライフサイクルを意識した連合的継続学習

arXiv cs.LG / 2026/4/23

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • この論文は、長期ミッション中に変化する地形へ適応する分散型自律フリート向けに、ライフサイクルを意識した二重時間尺度の連合的継続学習(FCL)フレームワークを提案しています。
  • 先行研究の主な限界として、ネットワーク層ごとの忘却感度の違いを考慮しない一様な保護、学習中の忘却防止に偏り長期的な累積ドリフトを扱えていない点、分散フリートの現実の不均一性を反映しない理想化シミュレーションに依存している点を取り上げています。
  • 提案手法は、局所学習中の即時忘却(学習時のpre-forgetting)を抑える層選択型リハーサルと、長期の累積ドリフト後に劣化したモデルを回復する迅速な知識回復(post-forgetting)を組み合わせています。
  • 忘却ダイナミクスの異質性に関する理論解析を示し、長期劣化は避けられないことを論じることで、回復メカニズムの必要性を裏付けています。
  • 実験では、最良の連合ベースラインに対して最大8.3%のmIoU改善、従来のファインチューニングに対して最大31.7%の改善が報告され、さらに実ローバーテストベッドで現実的な制約下における有効性も確認されています。

Abstract

フェデレーテッド・コンティニュアルラーニング(FCL)は、分散した自律フリートが、長期のミッションライフサイクルを通じて変化する地形タイプに対し、協調的に適応することを可能にします。しかし、現行のアプローチは次の重要な課題に直面しています。1) それらは一様な保護戦略を用いており、異なるネットワーク層での「忘却」に対する感度の違いを考慮できていません。2) 学習中の忘却の防止に主に焦点を当てる一方で、累積ドリフトによる長期的な影響には対処していません。3) 分散フリートに存在する現実世界の不均一性を捉えきれない、理想化されたシミュレーションに依存することが多いです。本論文では、学習時(事前の忘却)における予防と、忘却後(事後の回復)における回復を組み込んだ、ライフサイクルを考慮した二重タイムスケールFCLフレームワークを提案します。このフレームワークのもとで、ローカル学習中の即時の忘却を軽減する層選択的リハーサル戦略と、長期の累積ドリフトの後に劣化したモデルを復元する迅速な知識回復戦略を設計します。さらに、異種な忘却ダイナミクスを特徴付け、長期的な劣化が避けられないことを確立する理論的分析を提示します。実験結果は、本フレームワークが最も強力なフェデレーテッドのベースラインに対して最大8.3\%のmIoU改善を達成し、従来のファインチューニングに対して最大31.7\%の改善を達成することを示しています。また、現実世界のローバテストベッドにFCLフレームワークを展開し、現実的な制約下でのシステムレベルの頑健性を評価します。テスト結果は、我々のFCL設計の有効性をさらに裏付けています。