ロボット操作のための球面調和関数によるSE(3)準同変ハイブリッド可視運動フローポリシー

arXiv cs.RO / 2026/3/25

💬 オピニオンSignals & Early TrendsModels & Research

共有:

要点

本論文は、計算コスト、単一モダリティへの依存、そして高速サンプリング手法に伴う不安定性といった、従来の準同変拡散ポリシーの限界を克服するために設計された、SO(3)準同変ハイブリッド可視運動ポリシーフレームワーク「E3Flow」を提案する。
E3Flowは、効率的な整流フローと、球面調和表現を用いた安定かつ多モーダルな準同変学習を組み合わせ、厳密な回転準同変性を担保する。
ハイブリッドな視覚入力（点群と画像）を動的に融合し、追加の視覚的手がかりを球面調和特徴へ注入する、不変な特徴強化モジュール（FEM）を提案する。
8つのシミュレーション操作タスク（MimicGen）および4つの実環境実験における評価では、E3FlowがSpherical Diffusion Policyに対して平均成功率を3.12%向上させつつ、推論速度を7倍高速化することを示す。
著者らはGitHubでコードを公開しており、E3Flowをロボットのポリシー学習における「性能・効率・データ効率」の実用的な折り合いとして位置づけている。

日経XTECH

日経XTECH

Dev.to

Dev.to

Reddit r/artificial