不完全な人間デモンストレーションからの技能獲得のための統一的マルチレイヤー・フレームワーク

arXiv cs.RO / 2026/4/10

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、既存のヒューマンロボットインタラクション(HRI)における技能教授手法や学習(LfD: Learning from Demonstration)アプローチが断片的であり、効率的で直感的かつ広範に安全性を確保できる単一の枠組みが欠けていると主張する。
  • ユニバーサルロボットコンプライアンス(汎用的なロボットの順応性)を基盤として、堅牢で順守的なLfDのための統一的な3層制御フレームワークを提案する。
  • 第1層では、1回の人間デモンストレーションから軌道と可変インピーダンスの両方をリアルタイムに学習する手法を導入し、効率と再現の忠実度を向上させる。
  • 第2層では、運動教示における運動学的特異点を扱うためにナルスペース最適化を追加し、相互作用の感触を一貫に保つ。
  • 第3層では、ナルスペース・コンプライアンスを導入し、学習後に外部との相互作用へ順応的に適応できるようにしつつ、主要タスクの性能を維持する。7自由度のKUKA LWRで検証した。

Abstract

スキル教示のための現在のヒューマン・ロボット・インタラクション(HRI)システムは分断されており、文献中の既存アプローチでは、効率的で直感的かつ普遍的に安全であることを同時に満たす、まとまりのある枠組みが提示されていません。本論文は、ユニバーサルロボットのコンプライアンスを基盤として構築される、頑健で順応的な学習(Learning from Demonstration: LfD)を可能にすることで、この根本的なギャップを埋める新しい、階層化された制御フレームワークを提案します。提案手法は、3つの進行的で相互に連結された段階として構成されています。まず、単一のデモンストレーションから軌道と変数インピーダンスの両方を学習するリアルタイムLfD手法を導入し、効率と再現忠実度を大幅に向上させます。高品質で直感的な {kinesthetic teaching} を保証するために、次に、特異点を事前に管理し、人のデモンストレーション中に一貫した対話感覚を提供する、ヌル空間最適化戦略を提示します。最後に、一般化された安全性を確保するため、学習後の外部からの相互作用に対してロボット全身がコンプライアントに適応できる基盤となるヌル空間コンプライアンス手法を導入し、主タスクの性能を損なうことなく実現します。この最終的な貢献により、システムはエンドエフェクタ(EE)特化の用途を超えた、多用途なHRIプラットフォームへと変換されます。7自由度のKUKA LWRロボット上で、包括的な比較実験により、提案する完全な枠組みを検証します。その結果により、幅広いヒューマン・ロボット協調タスクに対して、より安全で、より直感的で、かつより効率的な統一システムが示されました。

不完全な人間デモンストレーションからの技能獲得のための統一的マルチレイヤー・フレームワーク | AI Navigate