HiPolicy: ポリシー学習のための階層型マルチ周波数アクション・チャンク化

arXiv cs.RO / 2026/4/8

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文では、ロボティクスの模倣学習に向けた階層型マルチ周波数アクション・チャンク化フレームワークである HiPolicy を提案し、長期的な依存関係のモデリングと、きめ細かなクローズドループ制御の両立を目指す。
HiPolicy は、各時間スケールに整合する履歴条件付き特徴を抽出・融合することで、複数の周波数でアクション列を予測し、粗い高レベルの計画と正確な反応動作の双方を可能にする。
さらに、行動の不確実性に基づいて、計画ホライズンと制御精度のトレードオフを適応的に切り替える、エントロピー誘導型の実行メカニズムを追加する。
シミュレーション上のベンチマークおよび実世界のマニピュレーション課題での実験により、HiPolicy は既存の 2D/3D の生成ポリシーに統合でき、性能を向上させると同時に実行効率も高められることが示される。

AI Business

日経XTECH

日経XTECH

Reddit r/MachineLearning

Hugging Face Blog