適応的タスク切り替え方針によるスパイキングニューラルネットワークを用いた自律エージェントのためのスケーラブルなマルチタスク学習
arXiv cs.RO / 2026/4/20
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、タスク干渉によりRLベースのマルチタスク性能が低下しがちな、リソース制約のある自律エージェントのスケーラブルなマルチタスク学習を目的とする。
- SwitchMTは、能動的樹状突起とデュエリング構造を備えたDeep Spiking Q-Networkに、タスク固有のコンテキスト信号を用いて専門化したサブネットワークを形成する仕組みを組み合わせる。
- 従来のSNNベースのRLが訓練中に固定されたタスク切り替え間隔に依存していた点を改善し、SwitchMTは報酬とネットワーク内部パラメータのダイナミクスの両方を手掛かりにする適応的タスク切り替え方針を提案する。
- Pong、Breakout、Enduroなど複数のAtariゲームおよびより長いゲームエピソードで、最先端手法に対して競争力のあるスコアが示され、ネットワークの複雑さを増やさずにタスク干渉へ対処できることが示唆される。
- 本手法は、スパイキング計算による低消費電力・省エネルギーを活かしつつ、訓練のスケーラビリティと有効性を高めることで、マルチタスク対応の知能エージェントを実現するものとして位置付けられている。



