統計的および意味論的フィルタリングによる模倣学習における失敗の特定
arXiv cs.RO / 2026/4/16
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、ロボティクスにおける模倣学習ポリシーは、制御された環境での性能が良好であっても、まれな分布外イベント(例:ハードウェア障害や予期しない人間の行動)が原因で、展開時に失敗しやすい(脆い)と主張する。
- 提案手法は FIDeL であり、ポリシーに依存しない失敗識別モジュールとして、視覚に基づく異常検知を、コンパクトな標準(nominal)デモンストレーション表現、最適輸送(optimal transport)によるマッチング、異常スコアリング、そして時空間(spatio-temporal)閾値の組み合わせにより、実行可能な失敗検知へと変換する。
- FIDeL は、頑健な閾値を設定するために、共形予測(conformal prediction)の拡張を用い、さらに視覚言語モデルによって、真の失敗ではない良性の逸脱を意味論的にフィルタリングする。
- 本研究では、失敗検知を評価するためのマルチモーダルな実環境ロボティクスデータセット BotFails を導入し、先行ベースラインに対して一貫した改善を報告する。
- 実験結果では、FIDeL が AUROC(異常検知)を +5.30% 改善し、また BotFails において既存手法と比べて失敗検知精度を +17.38% 向上させることが示される。




