DataEvolver:目標駆動ループエージェントでデータを生成し改善させる
arXiv cs.AI / 2026/5/5
📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research
要点
- 本論文は、明示的な目標に基づき、生成→検査→修正→フィルタリング→書き出しを繰り返して、画像編集やマルチモーダル理解向けの制御可能な学習データを作る「DataEvolver」を提案している。
- DataEvolverは、RGB画像、マスク、深度・法線マップ、メッシュ、姿勢、軌跡、レビュー記録など複数の永続的アーティファクトを管理できる設計になっている。
- 現行リリースでは、サンプル内の自己修正(生成時)とデータセット検証時のラウンド間自己拡張(検証時)という2つの連動ループを用いる。
- 実験では、画像レベルの物体回転タスクにおいて、固定のQwen-Edit LoRAプローブを使う提案手法「Ours+DualGate」が、ベースモデル未適応および公開されているマルチアングルLoRAよりもSpatialEditとホールドアウト評価セットで優れている。
- アブレーションでは、シーン認識に基づく生成からフィードバック駆動の修正、さらにデュアルゲートによる検証へと至る一貫した改善経路が示され、主要貢献は目標追跡・レビュー・修正・受理ループを備えた再利用可能なデータセット構築フレームワークだと位置づけられている。




