π0.7:創発的な能力を持つ操縦可能な汎用ロボティクス基盤モデル

arXiv cs.LG / 2026/4/20

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

要点

  • 本論文では、pi0.7という操縦可能なロボティクス基盤モデルを提案し、タスクごとの専用再学習をせずに幅広い状況で“すぐに”高い性能を発揮できることを目指しています。
  • pi0.7は、未見の環境で複雑な言語指示に従えるほか、キッチン家電を扱う多段階タスクなどにも対応し、さらにエンボディメントを跨いだゼロショット一般化(例:事前に見ずに洗濯物をたたむ)を示します。
  • エスプレッソマシンの操作のような難しいタスクでも、より特化した強化学習で微調整されたモデルに匹敵するレベルの性能を、ゼロショットで達成すると報告されています。
  • pi0.7の中核は、学習時に「多様なコンテキスト条件付け」を行う点で、プロンプトには言語による目標だけでなく、戦略を符号化する追加のマルチモーダルな操縦信号(例:性能メタデータやサブゴール画像)が含まれます。
  • デモンストレーションに加えて、失敗を含み得る自律データや、ロボット以外から取得したデータも活用し、複数のロボットプラットフォームと速度・器用さ・言語追従・合成的タスク一般化などのタスクで評価しています。

この記事の続きは原文サイトでお読みいただけます。

原文を読む →