Phone2Act:スケーラブルなVLAデータ収集のための低コストで汎用的なテレオペレーションシステム
arXiv cs.RO / 2026/5/5
📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research
要点
- Phone2Actは、特殊なロボット構成を必要とせずにVision-Language-Action(VLA)の操作データを高品質かつ低コストで収集することを目的とした、ハードウェア非依存のテレオペレーションシステムです。
- Google ARCoreを使って一般的なスマートフォンを6自由度(6-DoF)のロボットコントローラに変換し、ROS 2のモジュール設計と交換可能なブリッジノードによって、複数のロボット基盤に対してコード変更なしで対応できるようにしています。
- Universal RecorderがマルチカメラのRGBストリームとロボットの状態フィードバックを同期し、デモをLeRobotのデータセット形式でそのまま出力することで、後処理の手間を減らします。
- 検証では、収集した130エピソードでGR00T-N1.5を微調整し、実機のDobot CR5上での実環境マルチ段階ピック&プレース課題において成功率90%を達成しています。




