Bi-HIL：サブタスクレベルの進捗率とキーフレームメモリによる、双方向制御ベースのマルチモーダル階層模倣学習によって実現する長時間ホット接触を伴うロボット操作

arXiv cs.RO / 2026/3/27

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、部分観測と接触不確実性の下で、長時間のホット接触（接触の多い状況）を伴うロボット操作を安定化することを目的とした、双方向制御ベースのマルチモーダル階層模倣学習フレームワークであるBi-HILを提案する。
Bi-HILは、アクティブなサブタスク内における位相の進行を明示的にモデル化するサブタスクレベルの進捗率と、キーフレームメモリを追加することで、階層的な協調を改善する。
本手法は、高レベル・低レベルの両方のポリシーを条件付けし、階層的な時間的推論と力を意識した制御を組み合わせることで、不安定になり得るサブタスク遷移をより適切に扱えるようにする。
単腕および両腕の実ロボット課題に対する実験では、フラットポリシーベースラインおよび複数のアブレーション変種に比べて一貫した改善が示される。
全体として、頑健な長時間の操作においては、力を意識した双方向制御に加えて、サブタスクの進行を明示的に追跡することが重要であることを結果が強調している。

要旨: 長い時間軸にわたる、接触要素の多いロボットによる操作は、部分観測と、接触の不確実性下でのサブタスク遷移の不安定さによって依然として困難です。階層型アーキテクチャは時間的推論を改善し、両側（バイラテラル）の模倣学習は力を意識した制御を可能にしますが、既存の手法はしばしばフラットな方策に依存しており、長期の協調が難しいという課題があります。そこで本研究では、長期操作のための双方向制御ベースのマルチモーダル階層型模倣学習フレームワークであるBi-HILを提案します。Bi-HILは、キーフレームのメモリと、能動的なサブタスク内で位相の進行をモデル化し、さらに高レベルおよび低レベルの両方の方策を条件付けるサブタスク・レベルの進捗率を統合することで、階層的な協調を安定化します。Bi-HILを、単腕および両腕の実ロボット課題で評価したところ、フラットな手法やアブレーション版に対して一貫した改善が示されました。これらの結果は、頑健な長期操作のために、力を意識した制御とともにサブタスクの進行を明示的にモデル化することの重要性を強調しています。追加資料は以下をご覧ください: https://mertcookimg.github.io/bi-hil

AIツールを3つ以上並行して使うと「脳の疲労」を引き起こして生産性が低下する可能性

note

【AI心理臨床】生涯の安全基地をポケットに ─ 感情の捏ね鉢を携帯する

note

ベテランほど、AIを使った方がよい理由

note

「やらなきゃ」を「やりたい！」に変えたら、1日の景色が全く違って見えた話【大人の時間を整える、AI生活デザイン術】

note

死者をAIで「再現」できる時代に、私たちは何を守るべきか

note

Bi-HIL：サブタスクレベルの進捗率とキーフレームメモリによる、双方向制御ベースのマルチモーダル階層模倣学習によって実現する長時間ホット接触を伴うロボット操作

要点

関連記事

AIツールを3つ以上並行して使うと「脳の疲労」を引き起こして生産性が低下する可能性

【AI心理臨床】生涯の安全基地をポケットに ─ 感情の捏ね鉢を携帯する

ベテランほど、AIを使った方がよい理由

「やらなきゃ」を「やりたい！」に変えたら、1日の景色が全く違って見えた話【大人の時間を整える、AI生活デザイン術】

死者をAIで「再現」できる時代に、私たちは何を守るべきか

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

AIツールを3つ以上並行して使うと「脳の疲労」を引き起こして生産性が低下する可能性

【AI心理臨床】生涯の安全基地をポケットに ─ 感情の捏ね鉢を携帯する​

ベテランほど、AIを使った方がよい理由

「やらなきゃ」を「やりたい！」に変えたら、1日の景色が全く違って見えた話【大人の時間を整える、AI生活デザイン術】

死者をAIで「再現」できる時代に、私たちは何を守るべきか

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

【AI心理臨床】生涯の安全基地をポケットに ─ 感情の捏ね鉢を携帯する