AFFORD2ACT:汎化可能で軽量なロボット操作のためのアフォーダンス誘導による自動キーポイント選択
arXiv cs.RO / 2026/4/17
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文では、アフォーダンスに導かれて操作に関連する最小限のセマンティックな2Dキーポイント集合を選択するロボット操作フレームワークAFFORD2ACTを提案している。
- 密な画像やポイントクラウドを使わず、テキストプロンプトと1枚の画像からキーポイントを蒸留することで、計算負荷を下げ、無関係な背景特徴の影響を抑える狙いがある。
- AFFORD2ACTは3段階パイプライン(アフォーダンスによるフィルタリング、カテゴリーごとのキーポイント構築、埋め込み型ゲーティング付きのトランスフォーマーによるポリシー学習)で、最も重要なキーポイントに推論を集中させる。
- 得られるポリシーは軽量で、38次元の状態ポリシーで、プロプリオセプションや密表現に依存せず約15分で学習できるとされる。
- 多様な実環境の操作タスクで、未見の物体・新しいカテゴリ・異なる背景・注意をそらす要素に対しても82%の成功率を報告し、データ効率が向上するとしている。




