Web-Gewu:ロボット強化学習のためのブラウザベース・インタラクティブ・プレイグラウンド

arXiv cs.RO / 2026/4/21

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • この論文では、ロボット強化学習教育をより身近にすることを目的としたブラウザベースのインタラクティブ・プラットフォーム「Web-Gewu」が提案されます。
  • WebRTC のクラウド–エッジ–クライアント協調アーキテクチャを用い、物理シミュレーションとRLトレーニングはエッジノード側で実行し、クラウドはシグナリング中継のみに徹します。
  • ブラウザ上での低コストなP2P(peer-to-peer)リアルタイム配信を可能にすることで、学習者はローカルにインストールせずに、低いエンドツーエンド遅延で多様なロボットを操作できます。
  • さらに、RL報酬曲線を含む多次元のモニタリングデータをリアルタイム可視化し、事前に定義されたコマンド通信プロトコルに基づいて制御できます。
  • 著者らは、この設計が高いスケーラビリティと「参入障壁の低さ」を備え、身体知能(embodied intelligence)向けの学習における計算面・環境構築面の負担を大きく下げると主張しています。

要旨: 身体性を備えたインテリジェンスの急速な発展に伴い、ロボティクス教育には二重の課題があります。すなわち、高い計算コストの障壁と面倒な環境設定です。既存の集中的なクラウドシミュレーションの解決策は、多大なGPUおよび帯域コストを要するため、大規模な導入を妨げています。一方で、純粋なローカル計算は学習者のハードウェア制約によって強く制限されます。これらの問題に対処するため、我々は
\href{http://47.76.242.88:8080/receiver/index.html}{Web-Gewu} を提案します。これは、WebRTCのクラウド・エッジ・クライアント協調アーキテクチャに基づくインタラクティブなロボティクス教育プラットフォームです。本システムでは、物理シミュレーションおよび強化学習(RL)トレーニングのすべてをエッジノードへオフロードし、クラウドサーバは軽量なシグナリング中継のみを担います。これにより、極めて低コストなブラウザベースのピアツーピア(P2P)リアルタイムストリーミングを実現します。学習者は、ローカルへのインストールを一切行わずに、Webブラウザ上で低いエンドツーエンド遅延のまま複数形式のロボットと直接インタラクションできます。また、強化学習の報酬曲線を含む多次元のモニタリングデータのリアルタイム可視化を同時に観察可能です。事前に定義された堅牢なコマンド通信プロトコルと組み合わせることで、Web-Gewuは、身体性を備えたインテリジェンスのための、高いスケーラビリティを備えた「そのまま使える」かつ障壁のない教育基盤を提供し、最先端のロボティクス技術への参入障壁を大幅に引き下げます。