ResearchEVO:自動化された科学的発見とドキュメンテーションのためのエンドツーエンド・フレームワーク

arXiv cs.AI / 2026/4/8

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • ResearchEVOは、科学的発見を自動化し、その後に遡及的な説明とドキュメンテーションを行うエンドツーエンドのパイプラインを提案しており、「2段階のブレークスルー・ワークフロー」を模倣している。
  • Evolution(進化)フェーズでは、LLMによって導かれる二次元の共進化探索を用いて、フィットネスのみでコード実装を探索する。これにより、生成された解の理解を必要とせずに、アルゴリズムの論理と全体的なアーキテクチャの両方を最適化する。
  • Writing(執筆)フェーズでは、文単位のリトリーバル拡張生成(RAG)を用いて、幻覚(ハルシネーション)を抑制する検証と自動化された実験設計を組み込みながら、出版用の研究論文を生成する。
  • 本フレームワークは、原理に基づくアルゴリズム進化と、文献に根ざした科学的執筆を単一パイプラインで同時にカバーする最初のものだと主張されている。
  • 実験では、量子誤り訂正(実際のGoogleの量子ハードウェアデータを使用)と、物理インフォームド・ニューラルネットワークにより、新たに発見された、人が解釈可能なメカニズムが得られたとされ、さらに、捏造された引用がゼロの、コンパイル可能なLaTeX原稿が生成された。

要旨: 科学的ブレイクスルーにおける重要な反復パターンとして、2段階のプロセスが挙げられます。すなわち、予期しない発見をもたらす無方向な試行錯誤の最初の段階と、その発見がなぜ機能するのかを説明し、既存の理論の中で位置づける後付けの段階です。本稿では、この「発見してから説明する」パラダイムを計算機的に実装する、エンドツーエンドの枠組みであるResearchEVOを提示します。Evolution(進化)フェーズでは、LLMに導かれた双方向(bi-dimensional)の共進化を用います。これは、アルゴリズムの論理と全体のアーキテクチャの両方を同時に最適化し、生成する解の理解を一切必要とせず、純粋に適応度(fitness)によってコード実装の探索空間を探索します。つづくWriting(執筆)フェーズでは、最良の性能を示すアルゴリズムを取り、それを自律的に、明示的なアンチ・ハルシネーション検証と自動化された実験設計を伴う、文単位のリトリーバル拡張生成(retrieval-augmented generation)によって、完全で投稿可能な研究論文として生成します。私たちの知る限り、ResearchEVOはこの全パイプラインをエンドツーエンドで扱う最初のシステムです。先行研究は、原理に基づくアルゴリズム進化と、文献に根ざした科学的記述を共同で実行していません。我々は、この枠組みを2つの学際的な科学課題で検証します。すなわち、実在のGoogle量子ハードウェアのデータを用いた量子誤り訂正、そして物理に基づくニューラルネットワーク(Physics-Informed Neural Networks)です。いずれのケースでも、Evolutionフェーズは、当該領域の文献ではこれまで提案されていなかった、人が解釈可能なアルゴリズム上のメカニズムを発見しました。さらに両方の場合において、Writingフェーズは自律的にコンパイル可能なLaTeX原稿を生成し、RAGを通じてこれらの目隠しによる発見を既存の理論に正しく根拠づけました。捏造された引用はゼロでした。