Bi-HIL:サブタスクレベルの進捗率とキーフレームメモリによる、双方向制御ベースのマルチモーダル階層模倣学習によって実現する長時間ホット接触を伴うロボット操作

arXiv cs.RO / 2026/3/27

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、部分観測と接触不確実性の下で、長時間のホット接触(接触の多い状況)を伴うロボット操作を安定化することを目的とした、双方向制御ベースのマルチモーダル階層模倣学習フレームワークであるBi-HILを提案する。
  • Bi-HILは、アクティブなサブタスク内における位相の進行を明示的にモデル化するサブタスクレベルの進捗率と、キーフレームメモリを追加することで、階層的な協調を改善する。
  • 本手法は、高レベル・低レベルの両方のポリシーを条件付けし、階層的な時間的推論と力を意識した制御を組み合わせることで、不安定になり得るサブタスク遷移をより適切に扱えるようにする。
  • 単腕および両腕の実ロボット課題に対する実験では、フラットポリシーベースラインおよび複数のアブレーション変種に比べて一貫した改善が示される。
  • 全体として、頑健な長時間の操作においては、力を意識した双方向制御に加えて、サブタスクの進行を明示的に追跡することが重要であることを結果が強調している。

要旨: 長い時間軸にわたる、接触要素の多いロボットによる操作は、部分観測と、接触の不確実性下でのサブタスク遷移の不安定さによって依然として困難です。階層型アーキテクチャは時間的推論を改善し、両側(バイラテラル)の模倣学習は力を意識した制御を可能にしますが、既存の手法はしばしばフラットな方策に依存しており、長期の協調が難しいという課題があります。そこで本研究では、長期操作のための双方向制御ベースのマルチモーダル階層型模倣学習フレームワークであるBi-HILを提案します。Bi-HILは、キーフレームのメモリと、能動的なサブタスク内で位相の進行をモデル化し、さらに高レベルおよび低レベルの両方の方策を条件付けるサブタスク・レベルの進捗率を統合することで、階層的な協調を安定化します。Bi-HILを、単腕および両腕の実ロボット課題で評価したところ、フラットな手法やアブレーション版に対して一貫した改善が示されました。これらの結果は、頑健な長期操作のために、力を意識した制御とともにサブタスクの進行を明示的にモデル化することの重要性を強調しています。追加資料は以下をご覧ください: https://mertcookimg.github.io/bi-hil