VADF：効率的なロボットマニピュレーションのための、視覚適応型拡散ポリシーフレームワーク

arXiv cs.RO / 2026/4/20

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

ロボットマニピュレーションにおける拡散ポリシーは、サンプルの難しさを考慮しない一様サンプリングによりハードネガティブなクラス不均衡が生じ、学習の収束が遅く推論がタイムアウトしやすくなる。
提案手法VADFは視覚駆動のデュアル適応設計を採用し、モデルに依存しない（model-agnostic）ため、さまざまな拡散ポリシー構成に容易に組み込める。
学習段階では、Adaptive Loss Network（ALN）が各ステップの難しさをリアルタイムに予測し、ハードネガティブマイニングと重み付きサンプリングで高損失領域を優先することで収束を加速する。
推論段階では、Hierarchical Vision Task Segmenter（HVTS）が視覚入力に基づき高レベル指示を複数段階の低レベルサブ指示に分解し、単純な行為と複雑な行為でノイズスケジュールを変えることで計算量を削減し、初期成功率を高める。
本研究では、VADFが挙げられている拡散ポリシーの課題に対して、収束ステップ数の削減と推論の初期成功率向上を達成すると報告している。

Reddit r/MachineLearning

Dev.to

Dev.to

Dev.to

Dev.to