DataEvolver：目標駆動ループエージェントでデータを生成し改善させる

arXiv cs.AI / 2026/5/5

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

共有:

要点

本論文は、明示的な目標に基づき、生成→検査→修正→フィルタリング→書き出しを繰り返して、画像編集やマルチモーダル理解向けの制御可能な学習データを作る「DataEvolver」を提案している。
DataEvolverは、RGB画像、マスク、深度・法線マップ、メッシュ、姿勢、軌跡、レビュー記録など複数の永続的アーティファクトを管理できる設計になっている。
現行リリースでは、サンプル内の自己修正（生成時）とデータセット検証時のラウンド間自己拡張（検証時）という2つの連動ループを用いる。
実験では、画像レベルの物体回転タスクにおいて、固定のQwen-Edit LoRAプローブを使う提案手法「Ours+DualGate」が、ベースモデル未適応および公開されているマルチアングルLoRAよりもSpatialEditとホールドアウト評価セットで優れている。
アブレーションでは、シーン認識に基づく生成からフィードバック駆動の修正、さらにデュアルゲートによる検証へと至る一貫した改善経路が示され、主要貢献は目標追跡・レビュー・修正・受理ループを備えた再利用可能なデータセット構築フレームワークだと位置づけられている。