HiPolicy: ポリシー学習のための階層型マルチ周波数アクション・チャンク化
arXiv cs.RO / 2026/4/8
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文では、ロボティクスの模倣学習に向けた階層型マルチ周波数アクション・チャンク化フレームワークである HiPolicy を提案し、長期的な依存関係のモデリングと、きめ細かなクローズドループ制御の両立を目指す。
- HiPolicy は、各時間スケールに整合する履歴条件付き特徴を抽出・融合することで、複数の周波数でアクション列を予測し、粗い高レベルの計画と正確な反応動作の双方を可能にする。
- さらに、行動の不確実性に基づいて、計画ホライズンと制御精度のトレードオフを適応的に切り替える、エントロピー誘導型の実行メカニズムを追加する。
- シミュレーション上のベンチマークおよび実世界のマニピュレーション課題での実験により、HiPolicy は既存の 2D/3D の生成ポリシーに統合でき、性能を向上させると同時に実行効率も高められることが示される。



