流体力学におけるマルチエージェント自律推論に向けて

arXiv cs.AI / 2026/5/5

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • この論文は、単一エージェントのコンテキストウィンドウが、ツール仕様や観測トレースの蓄積により飽和する問題に対処するため、流体力学向けのマルチエージェント・システムを提案している。
  • Layer Execution Graph(LEG)を用い、プランナー・エージェントが自然言語ベースのルーティング・ヒューリスティックからクエリ固有の実行トポロジを構築し、専門エージェントは厳格なツール許可リストと補完的なデータ役割のもとで動作する。
  • コンソリデータ・エージェントが並列出力を簡潔なブリーフに統合し、リポーター・エージェントが最終回答を合成する一方、すべてのツール呼び出しの系譜(provenance)を実行ログとして記録して監査可能性を高める。
  • Claude Sonnet 4.6を専門・汎用の両エージェントのバックボーンとして用い、6つの複雑性カテゴリにまたがる37の流体力学クエリで評価した結果、事実精度93.6%かつパス率100%を達成し、並列実行(単一スレッド〜5並列)でも精度が90%超を維持しつつ、個々のデータソース欠落時にも部分的な回答を返して緩やかに劣化する。
  • プランナー主導でグラフ構造に基づくマルチエージェントのオーケストレーションは、モノリシックな単一エージェント設計が抱えるコンテキスト起因のボトルネックを実質的に緩和できることを示唆している。