HEX: 身体同調型エキスパートによる身体形態をまたぐ全身操作のための手法
arXiv cs.RO / 2026/4/10
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- HEXは、VLAモデルが身体の各部位を独立に扱うことから生じる不安定性に対処し、フルサイズの二足歩行ヒューマノイドロボットにおける安定した全身操作のための状態中心の枠組みを導入する。
- 本手法は、異種のロボット実装にまたがるスケーラブルな学習を可能にするヒューマノイドに整合した普遍的な状態表現を用い、協調的な運動モデリングのためのMixture-of-Experts(混合専門家)型の自己受容(プロプリオセプション)予測器を組み込む。
- HEXは、軽量な履歴トークンを活用して時間的な視覚文脈を効率よく保持し、推論時に過去画像を繰り返し符号化する必要を削減する。
- 残差ゲーティングによる融合メカニズムと、フローマッチング型のアクションヘッドを組み合わせ、視覚・言語の手がかりと自己受容のダイナミクスを統合して行動を生成する。
- 実世界のヒューマノイド操作実験では、タスク成功率において最先端の性能が報告され、特に素早い反応が必要なタスクや長いホライズンのタスクにおいて汎化性能が向上した。
