3DrawAgent:初期の対照的経験によりLLMに3D描画を教える
arXiv cs.CV / 2026/4/10
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、学習不要(training-free)の枠組みである3DrawAgentを提案し、自然言語プロンプトから3Dスケッチをベジェ曲線として逐次生成するためにLLMを用いる。
- 明示的な教師データによる厳密な監督ではなく、相対的経験最適化(relative experience optimization)を採用する。具体的には、ペア同士の比較によって一方のスケッチが他方より優れているかを判定し、その評価にはCLIPベースの知覚報酬に加え、LLMによるきめ細かな質的評価を用いる。
- 手法はGroup Reward Policy Optimization(GRPO)の枠組みを3Dの「空間認識(spatial awareness)」向上のために適応し、幾何学的なフィードバックを通じてモデルパラメータを更新せずにブラックボックス強化学習を可能にする。
- 実験では、3DrawAgentが複雑で一貫した3Dベジェスケッチを生成できること、幾何学的推論が自発的に現れること、さらに新規形状への汎化が示される。
- 全体として本研究は、初期の対照的/相対的経験シグナルを活用することで、学習不要の3Dスケッチ知能を進展させる新しいパラダイムを主張している。


