Phone2Act:スケーラブルなVLAデータ収集のための低コストで汎用的なテレオペレーションシステム

arXiv cs.RO / 2026/5/5

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • Phone2Actは、特殊なロボット構成を必要とせずにVision-Language-Action(VLA)の操作データを高品質かつ低コストで収集することを目的とした、ハードウェア非依存のテレオペレーションシステムです。
  • Google ARCoreを使って一般的なスマートフォンを6自由度(6-DoF)のロボットコントローラに変換し、ROS 2のモジュール設計と交換可能なブリッジノードによって、複数のロボット基盤に対してコード変更なしで対応できるようにしています。
  • Universal RecorderがマルチカメラのRGBストリームとロボットの状態フィードバックを同期し、デモをLeRobotのデータセット形式でそのまま出力することで、後処理の手間を減らします。
  • 検証では、収集した130エピソードでGR00T-N1.5を微調整し、実機のDobot CR5上での実環境マルチ段階ピック&プレース課題において成功率90%を達成しています。