強化学習における自律型海中ナビゲーションのためのタスク特化サブネットワーク発見
arXiv cs.LG / 2026/4/24
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、自律型海中ナビゲーションにおいて、事前学習済みのマルチタスク強化学習(RL)ポリシーネットワーク内部がどのように動くかを分析する。
- HoloOceanシミュレータ上で、異なるターゲット(種)に向けてナビゲーションする役割を担うタスク特化サブネットワークを特定・比較し、解釈可能性の向上を目指す。
- 関連するタスクを扱うコンテキスト付きマルチタスクRL設定では、ネットワークがタスクを区別するのに全重みの約1.5%のみを使うことが示された。
- タスクを分けるための重みのうち約85%は、入力層のコンテキスト変数ノードから次の隠れ層への結合であり、コンテキスト変数の重要性が強調される。
- 著者らは、共有部と専門化部の切り分けを明らかにすることで安全性を高め、モデル編集、転移学習、継続学習を効率化できると述べている。



