3Dダイナミクスに配慮したマニピュレーション：3D先読みによってマニピュレーション・ポリシーに能力を付与する

arXiv cs.RO / 2026/3/27

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

2Dベースの視覚ダイナミクスを用いる既存手法では、奥行き方向の大きな移動を伴う操作タスクで頑健性が不足するという課題を指摘しています。
3Dワールドモデリングとポリシー学習を統合した「3D dynamics-aware manipulation」フレームワークを提案し、3D先読み（3D foresight）を操作ポリシーに付与します。
フレームワーク内で自己教師ありの3つの学習タスク（現在の深度推定、将来RGB-D予測、3Dフロー予測）を導入し、互いに補完し合う形で3D予測能力を学習します。
シミュレーションと実環境の広範な実験により、推論速度を落とさずに操作性能を大幅に向上できることを報告しています。

Abstract

操作ポリシー学習への世界モデル化の導入は、操作の性能の限界を押し広げてきました。しかし、既存の取り組みは単に2次元の視覚ダイナミクスをモデル化するだけであり、対象タスクが目立った奥行き方向の移動を伴う場合の、堅牢な操作には不十分です。そこで本論文では、3D世界モデル化とポリシー学習をシームレスに統合する、3Dダイナミクス認識型の操作フレームワークを提案します。このフレームワーク内では、3つの自己教師あり学習タスク（現在の深度推定、将来のRGB-D予測、3Dフロー予測）を導入しており、これらは互いに補完し合い、ポリシーモデルに3Dの見通し（foresight）を与えます。シミュレーションおよび実世界における大規模な実験により、3Dの見通しは、推論速度を犠牲にすることなく、操作ポリシーの性能を大幅に向上できることが示されます。コードは https://github.com/Stardust-hyx/3D-Foresight で公開されています。

「船酔いさせる本」予定を早め先行リリース poevel L'automne à Arles 《アルルの秋》入れ子の吹雪が舞う ! Gemini に読ませたら !

note

amiami_@Japan

note

AIツールを3つ以上並行して使うと「脳の疲労」を引き起こして生産性が低下する可能性

note

【AI心理臨床】生涯の安全基地をポケットに ─ 感情の捏ね鉢を携帯する

note

Geminiを非表示にして快適な検索環境を取り戻す：PC・スマホ・Workspace別の消し方

note

3Dダイナミクスに配慮したマニピュレーション：3D先読みによってマニピュレーション・ポリシーに能力を付与する

要点

Abstract

関連記事

「船酔いさせる本」予定を早め先行リリース poevel L'automne à Arles 《アルルの秋》入れ子の吹雪が舞う ! Gemini に読ませたら !

amiami_@Japan

AIツールを3つ以上並行して使うと「脳の疲労」を引き起こして生産性が低下する可能性

【AI心理臨床】生涯の安全基地をポケットに ─ 感情の捏ね鉢を携帯する

Geminiを非表示にして快適な検索環境を取り戻す：PC・スマホ・Workspace別の消し方

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

Abstract

関連記事

「船酔いさせる本」予定を早め先行リリース poevel L'automne à Arles 《アルルの秋》入れ子の吹雪が舞う ! Gemini に読ませたら !

amiami_@Japan

AIツールを3つ以上並行して使うと「脳の疲労」を引き起こして生産性が低下する可能性

【AI心理臨床】生涯の安全基地をポケットに ─ 感情の捏ね鉢を携帯する​

Geminiを非表示にして快適な検索環境を取り戻す：PC・スマホ・Workspace別の消し方

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

【AI心理臨床】生涯の安全基地をポケットに ─ 感情の捏ね鉢を携帯する