要旨: 本技術レポートでは、教育データマイニング自動研究システム(EDM-ARS)を提示します。これは、エンドツーエンドの教育データマイニング(EDM)研究を自動化する、ドメイン特有のマルチエージェント・パイプラインです。私たちはEDM-ARSを、教育専門知識が研究ライフサイクルの各段階に組み込まれた、ドメイン対応の自動研究パイプラインの一般的なフレームワークとして概念化します。このフレームワークの最初の具体化として、予測モデリングタスクに焦点を当てます。この範囲内で、EDM-ARSは5つの専門的なLLM駆動エージェント(ProblemFormulator、DataEngineer、Analyst、Critic、Writer)を、改訂ループ、チェックポイントベースの復旧、サンドボックス化されたコード実行をサポートする状態機械コーディネータを通じて協調させます。研究プロンプトとデータセットが与えられると、EDM-ARSは実際のSemantic Scholarの引用、検証済みの機械学習分析、そして自動的な方法論的ピアレビューを備えた完全なLaTeX原稿を作成します。私たちはまた、システムアーキテクチャの詳細説明、教育ドメインの専門知識を符号化する3層データレジストリ設計、各エージェントの仕様、エージェント間通信プロトコル、およびエラーハンドリングと自己修正の仕組みの説明を提供します。最後に、単一データセットの範囲や定型的な論文出力を含む現在の制限について議論し、因果推論、転移学習、心理測定学、および複数データセット一般化へ向けた段階的なロードマップを概説します。EDM-ARSは、教育研究コミュニティを支援するためのオープンソースプロジェクトとして公開されています。
EDM-ARS: 自動化された教育データマイニング研究のためのドメイン特化型マルチエージェントシステム
arXiv cs.AI / 2026/3/20
📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research
要点
- EDM-ARSは、ワークフローのあらゆる段階に教育の専門知識を組み込むことで、エンドツーエンドの教育データマイニング研究を自動化するドメイン特化型マルチエージェントパイプラインを提示します。
- 5つのLLM駆動エージェント(ProblemFormulator、DataEngineer、Analyst、Critic、Writer)を、リビジョンループ、チェックポイントベースの回復、サンドボックス化されたコード実行をサポートする状態機械コントローラを介して調整します。
- 研究プロンプトとデータセットを与えられた場合、EDM-ARSは Semantic Scholar の実引用を含む完全な LaTeX 論文、検証済みの機械学習分析、そして自動化された方法論的ピアレビューを生成できます。
- 本報告は、システムアーキテクチャ、三層データレジストリ設計、エージェント仕様、エージェント間通信プロトコル、およびエラーハンドリングと自己修正機構の詳細を示すとともに、制限事項と将来の機能に向けたロードマップも明らかにしています。




