RESample:探索的サンプリングによるロバストなデータ拡張フレームワーク for ロボティックマニピュレーション

arXiv cs.RO / 2026/4/13

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • RESampleは、模倣学習データセットにおける分布のカバレッジ不足を対象とする、Vision-Language-Action(VLA)ロボティックマニピュレーション向けの自動データ拡張フレームワークとして提案される。
  • 本手法は、方策ロールアウト中にカバレッジのギャップを検出し、学習カバレッジを効率的に拡張するための探索的アクションを収集する探索的サンプリング機構を用いることで、分布外(OOD)環境での展開に対する頑健性を向上させる。
  • 軽量なCoverage Function(カバレッジ関数)により、学習データセット内の状態のカバレッジ密度を推定し、カバレッジの低い領域へ探索を導く。
  • LIBEROベンチマークおよび実世界のロボットタスクでの実験では、ベースラインに対して報告上12%の性能向上を達成し、追加サンプルは約10〜20%のみで済むことが示される。