要約: データ分析エージェントは、自動化された科学的発見と Innovating AI のビジョンの重要な触媒として現れつつあります。
しかし現在のアプローチは主にプロプライエタリモデルに対するプロンプト設計に依存しており、オープンソースモデルは多様な形式の大規模データファイルや、実世界の分析が要求する長期的かつ多段階の推論に直面するのに苦労しています。
本論文は、汎用データ分析エージェントの構築を目的とした、スケーラブルなデータ合成とエージェント訓練のレシピ DataMind を紹介します。
DataMind は、オープンソースのデータ分析エージェントを構築する際の三つの主要な課題、すなわちデータ資源の不足、不適切な訓練戦略、および不安定なコードベースのマルチターン展開に対処します。
具体的には、DataMind は 1) より細やかなタスク分類と再帰的な易-難タスク組成メカニズムを適用して、合成クエリの多様性と難易度を高める。2) 知識を補強した軌跡サンプリング戦略を、モデルベースとルールベースのフィルタリングに組み合わせる形で適用する。3) SFT と RL の損失を組み合わせた動的に調整可能な訓練目的。4) 記憶を節約し安定したコードベースのマルチターン展開フレームワーク。
DataMind を基盤として、データ分析タスクにおける多様なドメイン、タスクカテゴリ、およびデータファイル形式を網羅する高品質な軌跡セット DataMind-12K を編成します。
DataMind-12K で訓練した DataMind-14B は、複数のデータ分析ベンチマークで平均スコア 71.16% を達成し、最強のプロプライエタリベースライン DeepSeek-V3.1 および GPT-5 を上回る最先端の成果を示します。
私たちの DataMind-7B は、すべてのオープンソースモデルの中で最高の成績を示し、スコア 68.10% を記録しています。
さらに、探索的試行から得られた経験的洞察を分析実験に取り入れ、コミュニティに対してエージェント訓練に関する実用的な洞察を提供することを目指します。
コミュニティの将来の研究のために DataMind-12K および DataMind-14B を公開します。
汎用データ分析エージェントのスケーリング
arXiv cs.CL / 2026/3/16
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- DataMindは、データの多様な形式と長期的推論に対するオープンソースモデルの制約を克服することを狙い、拡張性のあるデータ合成とエージェント訓練のレシピとして提案されています。
- 細粒度のタスク分類法と再帰的な易から難への構成、モデルとルールに基づくフィルタリングを組み込んだ知識強化型軌跡サンプリング戦略、メモリ効率の良いマルチターン・ロールアウトフレームワーク、そして教師ありファインチューニングと強化学習を組み合わせた訓練目標が含まれます。
- DataMind-12Kデータセットにおいて、DataMind-14Bは複数のデータ分析ベンチマークで最先端の性能を達成し、DeepSeek-V3.1やGPT-5といった商用ベースラインを上回ります。一方、DataMind-7Bはオープンソースモデルの中でトップパフォーマンスを維持します。
- 著者らは将来の研究と評価を支援する目的で、DataMind-12KとDataMind-7Bおよび14Bをコミュニティへ公開する予定です。
- 探索的試行から得られた経験的洞察も提供し、研究者や実務者のエージェント訓練を導く手掛かりとします。

