広告

ROSClaw:エージェント型ロボット制御とインタラクションのための、OpenClawベースのROS 2フレームワーク

arXiv cs.RO / 2026/3/31

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、基盤モデルをROS 2ロボットに接続するモデル非依存のエグゼクティブ層としてROSClawを紹介し、推論/LLMバックエンドとロボット統合の詳細を切り離します。
  • ROSClawは、標準化されたアフォーダンス注入、マルチモーダル観測の正規化、構造化された監査ログによる動的な能力発見を提供し、構成によって異なるモデルやロボットを入れ替えられるようにします。
  • 物理ハードウェアにコマンドを実行する前に、ポリシー外のアクションを減らすため、セーフティ・エンベロープ内で実行前のアクション検証を設定可能に追加します。
  • 著者らは、ROSClawを3種類のロボット(車輪型、四足歩行、ヒューマノイド)と4つの基盤モデル・バックエンドに対して展開し、ポリシー外アクション提案率に大きなバックエンド依存の差があること、また物理的挙動がそれぞれ異なることを見出します。
  • ROSAに対するクロスフレームワークのパリティ・プロトコルにより、エグゼクティブ層の設計はプロンプト文言以上に、タスク完了と安全性に実質的な影響を与えることが示され、ROSClawはインフラストラクチャであると同時に、再現可能な身体性AIの計測ツールとして位置付けられます。

要旨: 基盤モデルは、ロボットに対して、終わりのない推論、言語理解、適応的な計画を与えることができます。しかし、今日ではモデルを物理ロボットに接続するには、知覚、駆動(アクチュエーション)、安全性を単一のモデルとプラットフォームに結び付ける、個別対応の統合が必要です。私たちはROSClawを提示します。ROSClawは、OpenClawエージェント実行環境をROS 2と統合する、モデル非依存の実行(エグゼキュータ)層です。これにより、任意の基盤モデルが、(i)標準化されたアフォーダンス注入による動的な能力発見、(ii)マルチモーダル観測の正規化、(iii)設定可能な安全な境界(セーフティ・エンベロープ)内での事前実行アクション検証、(iv)構造化された監査(オーディット)ログ、を通じて、ROS対応の任意のロボットを認識し、推論し、行動できるようになります。モデルのバックエンドやロボット・プラットフォームの差し替えは設定変更にすぎません。ツールのスキーマ、安全性の強制、プロヴェナンス(出所)ログは不変のままです。私たちはROSClawを、3つのプラットフォーム(車輪型、四足歩行型、人型)と、4つの基盤モデルのバックエンドに対して展開しました。この管理された基盤のもとで、モデルはアウト・オブ・ポリシー(方針外)なアクション提案率において最大4.8倍の差を示します(最前線のモデル同士に限ると3.4倍)。また、同一のコマンドから、質的に異なる物理的挙動が生成されます。ROSAに対する枠組み横断のパリティ(同等性)プロトコルによって、プロンプト文言だけでなく実行層の設計が、タスク完了と安全行動の両方に対して有意に影響することが確認され、ROSClawは、実用的なエージェントロボット基盤であると同時に、身体性(エンボディド)AIのための再現可能な計測手段でもあることが示されます。

広告