DataSTORM：探索的データ分析とデータ・ストーリーテリングによる大規模データベースのための深層リサーチ

arXiv cs.CL / 2026/4/9

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

DataSTORMは、インターネット情報に焦点を当てた手法では埋めきれないギャップに対処しつつ、構造化された大規模データベースにわたる深いリサーチを行うための、LLMベースのエージェント型システムである。
このアプローチでは、探索的データ分析（Exploratory Data Analysis）とデータ・ストーリーテリング（Data Storytelling）を用いて、深い構造化データのリサーチを「論文（テーゼ）駆動」のプロセスとして捉える。すなわち、候補となるテーゼを生成し、それを反復的なソース横断調査によって検証し、首尾一貫したナラティブへ収束させる。
InsightBenchでの評価により、DataSTORMは新たな最先端性能を達成し、洞察レベルの再現率（insight-level recall）が先行手法に比べて19.4%向上し、要約レベルのスコアが7.2%向上した。
本論文ではさらにACLEDに由来するデータセットを導入し、DataSTORMが自動評価指標および人手評価の両方で、ChatGPT Deep Researchのようなプロプライエタリなシステムを上回ることを報告している。

Abstract

大規模言語モデル（LLM）エージェントによるディープリサーチは、多段階の情報探索、統合、分析のための強力なパラダイムとして登場しつつあります。しかし、既存のアプローチは主に非構造化のウェブデータに焦点を当てている一方で、大規模な構造化データベースに対してディープリサーチを行う際の課題は、比較的十分に検討されていません。ウェブベースの調査とは異なり、データ中心の効果的な研究には、単なる取得（リトリーバル）と要約以上のものが必要であり、反復的な仮説生成、構造化スキーマに対する定量的推論、そして首尾一貫した分析的ナラティブへ収束することが求められます。本論文では、DataSTORM を提案します。これは、LLMベースのエージェントシステムであり、大規模な構造化データベースとインターネットソースの両方にまたがって、自律的に研究を実行できます。探索的データ解析（Exploratory Data Analysis）とデータ・ストーリーテリング（Data Storytelling）の原理に基づき、DataSTORM は、構造化データに対するディープリサーチを、論文（テーゼ）主導の分析プロセスとして再定義します。すなわち、データから候補となるテーゼを発見し、それらを複数ソースにまたがる反復的な調査によって検証し、最終的にそれらを首尾一貫した分析的ナラティブへと発展させます。InsightBench において DataSTORM を評価したところ、インサイトレベルの再現（recall）で相対的に 19.4% の改善、要約レベルのスコアで 7.2% の改善を達成し、新たな最先端（state-of-the-art）の結果を得ました。さらに、実世界の複雑なデータベースである ACLED に基づいて構築した新しいデータセットを導入し、DataSTORM が、自動評価指標と人手評価の両方の観点で、ChatGPT Deep Research のような専用（プロプライエタリ）システムを上回ることを示します。

💡 この記事が使われたインサイト

AIの最新ニュースをまとめた「今日の要点」で、この記事が取り上げられています。

📅 4/9Dailyインサイトを見る →

Black Hat Asia

AI Business

テスラの巨大AI半導体工場、インテル参画テラファブ「製造技術を刷新」

日経XTECH

エプソン、インクジェットで半導体製造ラピダスに出資「連携深める」

日経XTECH

データサイエンティストの役割 AIで変わる、分析から「価値創造」へ

日経XTECH

ベイシアグループが横断ハッカソン、業務時間の5％を他事業へ割り当て

日経XTECH

DataSTORM：探索的データ分析とデータ・ストーリーテリングによる大規模データベースのための深層リサーチ

要点

Abstract

💡 この記事が使われたインサイト

関連記事

Black Hat Asia

テスラの巨大AI半導体工場、インテル参画テラファブ「製造技術を刷新」

エプソン、インクジェットで半導体製造ラピダスに出資「連携深める」

データサイエンティストの役割 AIで変わる、分析から「価値創造」へ

ベイシアグループが横断ハッカソン、業務時間の5％を他事業へ割り当て

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

Abstract

💡 この記事が使われたインサイト

関連記事

Black Hat Asia

テスラの巨大AI半導体工場、インテル参画 テラファブ「製造技術を刷新」

エプソン、インクジェットで半導体製造 ラピダスに出資「連携深める」

データサイエンティストの役割 AIで変わる、分析から「価値創造」へ

ベイシアグループが横断ハッカソン、業務時間の5％を他事業へ割り当て

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

テスラの巨大AI半導体工場、インテル参画テラファブ「製造技術を刷新」

エプソン、インクジェットで半導体製造ラピダスに出資「連携深める」