DataSTORM:探索的データ分析とデータ・ストーリーテリングによる大規模データベースのための深層リサーチ
arXiv cs.CL / 2026/4/9
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- DataSTORMは、インターネット情報に焦点を当てた手法では埋めきれないギャップに対処しつつ、構造化された大規模データベースにわたる深いリサーチを行うための、LLMベースのエージェント型システムである。
- このアプローチでは、探索的データ分析(Exploratory Data Analysis)とデータ・ストーリーテリング(Data Storytelling)を用いて、深い構造化データのリサーチを「論文(テーゼ)駆動」のプロセスとして捉える。すなわち、候補となるテーゼを生成し、それを反復的なソース横断調査によって検証し、首尾一貫したナラティブへ収束させる。
- InsightBenchでの評価により、DataSTORMは新たな最先端性能を達成し、洞察レベルの再現率(insight-level recall)が先行手法に比べて19.4%向上し、要約レベルのスコアが7.2%向上した。
- 本論文ではさらにACLEDに由来するデータセットを導入し、DataSTORMが自動評価指標および人手評価の両方で、ChatGPT Deep Researchのようなプロプライエタリなシステムを上回ることを報告している。



