KinDER:ロボット学習と計画のための物理推論ベンチマーク

arXiv cs.RO / 2026/4/29

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • KinDERは(arXiv:2604.25788v1)、ロボットの学習と計画で必要となる「身体性に基づく運動学・動力学的推論」を扱う新しいロボティクス向けベンチマークです。
  • ベンチマークには、25個の手続き的に生成されたGymnasium対応環境と、パラメータ化されたスキルやデモを提供するPythonライブラリ、さらに標準化された評価スイート(計画・模倣学習・強化学習・基盤モデル系アプローチを含む13のベースライン)が含まれます。
  • KinDERは、空間関係、非把持型の複数物体操作、道具の使用、組合せ的な幾何制約、動的制約という5つの中核的な物理推論課題を切り分け、知覚・言語理解・アプリケーション固有の複雑さから切り離して設計されています。
  • 実験では、既存手法が多くの環境を解けないことが示され、現在の物理推論能力に大きなギャップがあることが明らかになります;また移動マニピュレータでの実機-シミュレーション-実機(real-to-sim-to-real)実験により、シミュレーションと現実の物理相互作用の対応度を評価します。
  • KinDERは完全にオープンソースで、ロボットにおける物理推論の研究を前進させるために、異なるパラダイム間で体系的な比較を行えることを目的としています(サイトとコードが提供されています)。

Abstract

現実世界の物理環境と相互作用するロボティックシステムは、自身の身体性、環境、そして取り組むタスクによって課される運動学的および動力学的な制約について推論する必要があります。私たちは、ロボット学習と計画において生じる物理的推論の課題を対象とした、運動学的および動力学的な身体化推論のベンチマークであるKinDERを提案します。KinDERは、手続き的に生成された25の環境、パラメータ化されたスキルとデモンストレーションを備えたGymnasium互換のPythonライブラリ、ならびにタスクと運動計画、模倣学習、強化学習、基盤モデルに基づくアプローチを含む13の実装済みベースラインにまたがる標準化された評価スイートから構成されます。これらの環境は、知覚、言語理解、そしてアプリケーション固有の複雑さから切り離して、5つの中核となる物理的推論の課題――基本的な空間関係、非把持型の多物体操作、ツール使用、組合せ的な幾何学的制約、動的制約――を分離するように設計されています。実験的評価では、既存手法が多くの環境を解くのが難しいことが示されており、物理的推論に関する現在のアプローチには大きなギャップが存在することが分かります。さらに、移動式マニピュレータを用いた実環境→シミュレーション→実環境の実験を追加し、シミュレーションと現実世界の物理的相互作用との対応関係を評価します。KinDERは完全にオープンソースであり、ロボティクスにおける物理的推論を前進させるために、多様なパラダイム間で体系的な比較を可能にすることを意図しています。Website and code: https://prpl-group.com/kinder-site/