データ・アナロジーが効率的なエンボディメント間転送を実現する

arXiv cs.RO / 2026/3/23

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、一般的なロボットポリシーのためのエンボディメント間転送を可能にするため、さまざまなデモンストレーションデータをどのように組織するかを調査する。
幅広い多様性とデータ・アナロジー（エンボディメントを跨ぐ場面、タスク、軌跡を対になるデモンストレーションで揃える）を比較し、アナロジーが形態転送に対して最大の利得をもたらすことを見出した。
視点のような知覚的シフトは広範囲の多様性から最も恩恵を受ける一方、構造化されていない多様性は形態転送の改善には限定的である。
実世界の実験では、モデルや学習手順を変更せず、データの構成のみを変更することで、エンボディメント間転送を平均22.5%改善できた。
この知見は、異なるロボットのエンボディメント間の転送を向上させるために、意図的なアナロジーを持つ訓練データの設計を提唱する。

要約：汎用的なロボットポリシーは、さまざまなロボット、シーン、視点から収集されたデモンストレーションを用いて訓練されます。とはいえ、このような異種データをどのように最適に整理・スケールさせれば、特定のターゲット設定における性能を本当に向上させることができるのかは未だ不明です。本研究では、ロボットのセットアップ間での転移を可能にするデモンストレーションデータのどの形式が最も有用かを問います。エンドエフェクタの形態、ロボットプラットフォームの外観、カメラの視点を変化させた統制実験を行い、デモンストレーションの数を単純に増やす効果と、さまざまな方法で体系的に多様性を広げる効果を比較します。私たちのシミュレーション実験は、視点のような知覚的変化は広い多様性から最も恩恵を受ける一方で、形態の変化は非構造的な多様性からははるかに少ない恩恵しか受けず、すなわち、異なる実装間でシーン、タスク、および/または軌道を揃えるペアのデモンストレーションから最大の効果を得ることを示しています。シミュレーション結果を踏まえ、データの構成だけを変更することで、大規模なペアなしデータセットに対する実世界での異なる実装間転送の成功率を平均で $22.5\%$ 向上させます。