科学的可視化におけるLLMエージェントの相互作用パラダイムを探る

arXiv cs.AI / 2026/5/1

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、自然言語の指示から可視化ワークフローを生成するSciVisタスクにおいて、さまざまなLLMエージェントの相互作用パラダイムがどの程度機能するかを評価しています。
  • ドメイン特化型エージェント(構造化ツール利用)、コンピュータ操作型エージェント、汎用のコーディング型エージェントを、15のベンチマークタスクで比較し、可視化品質・効率・頑健性・計算コストを測定しています。
  • 汎用コーディング型エージェントはタスク成功率が最も高い一方で計算コストが大きく、ドメイン特化型エージェントは効率と安定性に優れるが柔軟性が低いことが示されます。
  • コンピュータ操作型エージェントは個々のステップでは良好な結果を出すものの、長い複数ステップのワークフローでは苦戦し、長期ホライゾンの計画が主要な制約であることが示唆されます。
  • 永続メモリはCLIとGUIの両方の設定で、繰り返し試行において性能を向上させますが、その効果の大きさは相互作用モードとフィードバック品質に依存します。