夢のように把持する：生成された人間のデモンストレーションから機能的把持を模倣する

arXiv cs.RO / 2026/4/10

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、視覚生成モデル（VGM）を用いて生成した人間のデモンストレーションにより、オープンワールド環境におけるゼロショットの機能的ロボット把持を可能にする GraspDreamer を提案する。
大規模なインターネット上の人間データで訓練された VGM は、物理世界における人間の相互作用に関する潜在的な事前知識（ラテント・プライア）を含んでおり、労力の大きい現実世界でのデータ収集の必要性を減らせると主張する。
提案手法は、これらの合成デモンストレーションと、身体化（embodiment）に固有な行動最適化を組み合わせることで、追加の手間を最小限にしながら把持性能を実現する。
公開ベンチマークおよび実ロボットでの評価に関する実験により、GraspDreamer は、異なるロボットハンド間において、従来手法に比べてデータ効率と汎化性能を改善することが示される。
本研究はさらに、下流の操作タスクへの拡張や、視覚運動（visuomotor）ポリシー学習を支えるデータを生成できることも示している。

AI Business

日経XTECH

日経XTECH

日経XTECH

Reddit r/artificial