Sentinel-VLA:動的推論とエラー回復のためのアクティブ状態モニタリングを備えたメタ認知VLAモデル
arXiv cs.RO / 2026/5/5
📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research
要点
- 本論文では、実行のリアルタイム状態を監視するメタ認知的な「sentinel」モジュールを備えた視覚言語行動(VLA)モデルSentinel-VLAを提案している。
- Sentinel-VLAは、初期計画やエラー検出時など必要なときだけ動的推論やエラー回復を行い、頑健性を高めつつ計算コストの増加を抑えることを目指している。
- 学習には、自動生成・自動アノテーションされたデータパイプラインを用い、44タスク・2.6百万超の遷移をカバーする。
- さらに、能力の境界を特定してデータ収集を自動化するSelf-Evolving Continual Learning(SECL)と、壊滅的忘却を防ぐためにパラメータ更新を直交空間へ制限するOrthogonal Continual Adapter(OC-Adapter)を組み合わせている。
- 実環境の実験では、Sentinel-VLAが従来のSOTAモデルPI0に比べてタスク成功率を30%以上向上したと報告されており、コード・重み・データ生成パイプラインをオープンソース化する予定だと述べている。

