多タスク制御と適応のためのニューラルオペレータ
arXiv cs.LG / 2026/4/7
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、多タスクの最適制御に対するニューラルオペレータ手法を研究し、タスク記述(例:ダイナミクス/コスト関数)から最適なフィードバック制御則への写像を学習する。
- 誘導対象の順序に不変なニューラルオペレータ構造を提案し、行動クローン(behavioral cloning)で1つのオペレータを学習することで、解オペレータを正確に近似できること、さらに未見および分布外タスクへも汎化できることを示す。
- パラメトリックな最適制御環境およびロコモーションのベンチマークにまたがる実験により、タスクに対して観測量が変化しても頑健であることを示す。
- 分岐(branch)-幹(trunk)の構造を活用することで効率的なタスク適応を可能にし、軽量な更新から完全な微調整までの幅広い戦略を提供する。
- さらに、初期化を最適化することで少数ショット適応を行うメタ学習済みオペレータのバリアントを導入し、データが限られた設定において人気のメタラーニング基準手法を上回ることを示す。




