汎用データ分析エージェントのスケーリング

arXiv cs.CL / 2026/3/16

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

DataMindは、データの多様な形式と長期的推論に対するオープンソースモデルの制約を克服することを狙い、拡張性のあるデータ合成とエージェント訓練のレシピとして提案されています。
細粒度のタスク分類法と再帰的な易から難への構成、モデルとルールに基づくフィルタリングを組み込んだ知識強化型軌跡サンプリング戦略、メモリ効率の良いマルチターン・ロールアウトフレームワーク、そして教師ありファインチューニングと強化学習を組み合わせた訓練目標が含まれます。
DataMind-12Kデータセットにおいて、DataMind-14Bは複数のデータ分析ベンチマークで最先端の性能を達成し、DeepSeek-V3.1やGPT-5といった商用ベースラインを上回ります。一方、DataMind-7Bはオープンソースモデルの中でトップパフォーマンスを維持します。
著者らは将来の研究と評価を支援する目的で、DataMind-12KとDataMind-7Bおよび14Bをコミュニティへ公開する予定です。
探索的試行から得られた経験的洞察も提供し、研究者や実務者のエージェント訓練を導く手掛かりとします。

要約: データ分析エージェントは、自動化された科学的発見と Innovating AI のビジョンの重要な触媒として現れつつあります。
しかし現在のアプローチは主にプロプライエタリモデルに対するプロンプト設計に依存しており、オープンソースモデルは多様な形式の大規模データファイルや、実世界の分析が要求する長期的かつ多段階の推論に直面するのに苦労しています。
本論文は、汎用データ分析エージェントの構築を目的とした、スケーラブルなデータ合成とエージェント訓練のレシピ DataMind を紹介します。
DataMind は、オープンソースのデータ分析エージェントを構築する際の三つの主要な課題、すなわちデータ資源の不足、不適切な訓練戦略、および不安定なコードベースのマルチターン展開に対処します。
具体的には、DataMind は 1) より細やかなタスク分類と再帰的な易-難タスク組成メカニズムを適用して、合成クエリの多様性と難易度を高める。2) 知識を補強した軌跡サンプリング戦略を、モデルベースとルールベースのフィルタリングに組み合わせる形で適用する。3) SFT と RL の損失を組み合わせた動的に調整可能な訓練目的。4) 記憶を節約し安定したコードベースのマルチターン展開フレームワーク。
DataMind を基盤として、データ分析タスクにおける多様なドメイン、タスクカテゴリ、およびデータファイル形式を網羅する高品質な軌跡セット DataMind-12K を編成します。
DataMind-12K で訓練した DataMind-14B は、複数のデータ分析ベンチマークで平均スコア 71.16% を達成し、最強のプロプライエタリベースライン DeepSeek-V3.1 および GPT-5 を上回る最先端の成果を示します。
私たちの DataMind-7B は、すべてのオープンソースモデルの中で最高の成績を示し、スコア 68.10% を記録しています。
さらに、探索的試行から得られた経験的洞察を分析実験に取り入れ、コミュニティに対してエージェント訓練に関する実用的な洞察を提供することを目指します。
コミュニティの将来の研究のために DataMind-12K および DataMind-14B を公開します。

生成AIが「下手な鉄砲」型サイバー攻撃を増やす、足元固めを急ごう

日経XTECH

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

日経XTECH

NEC、「暗黙知」をAIで可視化—危険の予兆を映像から検出し、改善アドバイスを自動生成する技術を世界初開発

Innovatopia

LLMが数学の未解決問題を解いた日 — Epoch.ai FrontierMathと、人間とAIの協働が開く新しい研究スタイル

Qiita

AI生成で児童性的虐待をリアルに描写した画像・動画は前年比14％増の8029件確認されたという報告、特に動画件数は1年で260倍以上も増加

GIGAZINE

汎用データ分析エージェントのスケーリング

要点

関連記事

生成AIが「下手な鉄砲」型サイバー攻撃を増やす、足元固めを急ごう

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

NEC、「暗黙知」をAIで可視化—危険の予兆を映像から検出し、改善アドバイスを自動生成する技術を世界初開発

LLMが数学の未解決問題を解いた日 — Epoch.ai FrontierMathと、人間とAIの協働が開く新しい研究スタイル

AI生成で児童性的虐待をリアルに描写した画像・動画は前年比14％増の8029件確認されたという報告、特に動画件数は1年で260倍以上も増加

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer