ロボット操作のための球面調和関数によるSE(3)準同変ハイブリッド可視運動フローポリシー

arXiv cs.RO / 2026/3/25

💬 オピニオンSignals & Early TrendsModels & Research

要点

  • 本論文は、計算コスト、単一モダリティへの依存、そして高速サンプリング手法に伴う不安定性といった、従来の準同変拡散ポリシーの限界を克服するために設計された、SO(3)準同変ハイブリッド可視運動ポリシーフレームワーク「E3Flow」を提案する。
  • E3Flowは、効率的な整流フローと、球面調和表現を用いた安定かつ多モーダルな準同変学習を組み合わせ、厳密な回転準同変性を担保する。
  • ハイブリッドな視覚入力(点群と画像)を動的に融合し、追加の視覚的手がかりを球面調和特徴へ注入する、不変な特徴強化モジュール(FEM)を提案する。
  • 8つのシミュレーション操作タスク(MimicGen)および4つの実環境実験における評価では、E3FlowがSpherical Diffusion Policyに対して平均成功率を3.12%向上させつつ、推論速度を7倍高速化することを示す。
  • 著者らはGitHubでコードを公開しており、E3Flowをロボットのポリシー学習における「性能・効率・データ効率」の実用的な折り合いとして位置づけている。

ロボット操作のための球面調和関数によるSE(3)準同変ハイブリッド可視運動フローポリシー | AI Navigate