EquiBim:両腕マニピュレーションのための対称性同変ポリシー学習
arXiv cs.RO / 2026/3/25
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、模倣学習設定における両腕(デュアルアーム)ロボット操作のための、対称性同変ポリシー学習フレームワーク「EquiBim」を提案する。
- 双方の物理的対称性を、観測空間と行動空間の双方に対する群作用として明示的にモデル化し、同変性制約を課すことで、ポリシーが対称変換の下でも一貫した振る舞いをするようにする。
- EquiBimはモデルに依存せず(model-agnostic)、異なる観測モダリティ(例:画像、点群)や行動表現(例:手先(エンドエフェクタ)空間、関節空間)にまたがって、複数の模倣学習パイプラインに統合できる。
- RoboTwinのデュアルアームプラットフォームでの評価では、シミュレーションにおける分布シフトに対する頑健性とともに性能が向上し、実世界のデュアルアームシステムでも追加の検証が行われている。
- 著者らは、物理的対称性を帰納バイアスとして取り入れることは、そもそとタスクや運動学構造が対称であるにもかかわらず、ロボットが非対称または不整合な挙動を示すのを抑えるための、単純で効果的な方法であると結論づけている。