PaperOrchestra:自動AI研究論文執筆のためのマルチエージェントフレームワーク

arXiv cs.AI / 2026/4/8

💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • PaperOrchestraは、制約のないAI研究の事前執筆素材を、文献の統合やプロット・図表などの自動生成ビジュアルを含む、投稿準備済みのLaTeX原稿へと変換するマルチエージェントフレームワークとして提示される。
  • 本研究は、既存の自律的な論文執筆システムが特定の実験パイプラインに過度に結び付いており、表面的な文献レビューを生成しがちであると主張している。
  • 著者らは、AI分野のトップクラス会議論文200本から逆解析して得た生の素材をもとに構築した、標準化ベンチマーク「PaperWritingBench」を導入する。
  • 人手による並置評価では、PaperOrchestraは自律ベースラインに比べて大幅に優れていると報告されており、文献レビューの質での大きな改善(絶対ウィンレート差で50%〜68%)および原稿全体の質での改善(14%〜38%)が示されている。

要旨: 非構造化された研究資料を論文原稿へと統合することは、AI駆動型の科学的発見において不可欠である一方、十分に掘り下げられていない課題です。既存の自律的ライターは特定の実験パイプラインに硬直的に結び付いており、表面的な文献レビューしか作成できません。我々は、論文執筆の自動化のためのマルチエージェント・フレームワークであるPaperOrchestraを提案します。PaperOrchestraは、制約のない事前執筆素材を、投稿可能なLaTeX原稿へと柔軟に変換します。そこには、包括的な文献統合と、プロットや概念図などの生成ビジュアルが含まれます。性能を評価するために、我々は最初の標準化ベンチマークであるPaperWritingBenchを提示します。このベンチマークは、トップクラスのAIカンファレンス論文200本から逆コンパイルした生の素材に基づくものであり、さらに包括的な一連の自動評価器を併せて提供します。人手評価による並列比較では、PaperOrchestraは自律型ベースラインを大きく上回り、文献レビューの品質において絶対的な勝率の優位が50%〜68%、原稿全体の品質において14%〜38%を達成します。