安全な協調マニピュレーションにおける行動変化検出のための信念ダイナミクス
arXiv cs.LG / 2026/4/8
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、共有作業空間にいるロボットが、協調エージェントがエピソードの途中で行動戦略を切り替えると安全でなくなり得て、ロボットが古い前提のまま動き続けてしまう問題に取り組む。
- ManiSkillの共有作業空間におけるマニピュレーション課題で、10種類のレジーム(状況)切替検出手法にわたって評価したところ、検出を可能にすることで切替後の衝突を52%削減できるが、検出許容度によって信頼性は大きく変動する。
- 現実的な許容度 ±3ステップでは検出性能が86%から30%まで幅広く分布し、一方でより緩い許容度 ±5ではすべての手法が100%に到達することから、実運用上の制約が示される。
- 著者らはUA-TOMを提案する。UA-TOMは軽量な信念(belief)追跡モジュールであり、凍結した視覚言語アクション制御バックボーンに対して、選択的な状態空間ダイナミクス、因果的注意(causal attention)、予測誤差シグナルを付加する。これにより検出率(±3で85.7%)が向上し、近距離での時間(4.8ステップ)が短縮され、さらに提案手法の指標ではOracleを上回る。
- UA-TOMの解析によれば、レジーム切替により隠れ状態(hidden-state)更新の大きさが17倍に増加し、その値は約10タイムステップで減衰する。推論オーバーヘッドは7.4 ms(50 msの制御予算の14.8%)であり、加えて他ドメインであるOvercookedの実験でも相補的な行動が検証された。




