研究質問から科学的ワークフローへ：科学オートメーションのためのエージェント型AI活用

arXiv cs.AI / 2026/4/25

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

共有:

要点

本記事は、科学ワークフローの自動実行は進んでいる一方で、研究質問をワークフロー仕様へ変換する「意味的な翻訳」は依然として人手で行われている点が課題だと述べています。
提案では、自然言語を構造化された意図に変換するLLM（セマンティック層）、再現可能なワークフローDAGを生成する検証済みのジェネレータ（決定論層）、そしてドメイン専門家が作成する「Skills」（知識層）を用いてギャップを埋めます。
LLMの非決定性を意図抽出に限定することで、同一の意図からは同一のワークフローが生成されるため、信頼性と再現性が高まる設計になっています。
実装と評価は、1000 Genomesの集団遺伝学ワークフローとHyperflow WMSをKubernetes上で用いて行われ、意図精度の大幅な向上やデータ転送量の削減が報告されています。
150件のクエリを対象にしたアブレーション研究では、Skillsによりフルマッチの意図精度が44%から83%へ上昇し、LLMオーバーヘッドは15秒未満・コストはクエリあたり0.001ドル未満に抑えられたとされています。

概要: 科学ワークフローシステムは実行を自動化します――スケジューリング、フォールトトレランス、リソース管理――しかし、それに先立つセマンティックな翻訳は自動化しません。科学者は依然として、研究課題を手作業でワークフロー仕様へと変換しています。この作業には、ドメイン知識とインフラストラクチャに関する専門知識の両方が必要です。本稿では、このギャップを埋めるエージェント型のアーキテクチャを提案します。それは3つの層から成ります。すなわち、LLMが自然言語を構造化された意図（セマンティック層）へ解釈する層、検証されたジェネレータが再現可能なワークフローDAGを生成する層（決定論的層）、そしてドメインの専門家が「Skills」を執筆する層です。ここでいうSkillsは、語彙マッピング、パラメータ制約、最適化戦略をエンコードしたmarkdownドキュメントです（知識層）。この分解により、LLMの非決定性は意図抽出に閉じ込められます。つまり、同一の意図は常に同一のワークフローを生み出します。私たちは、このアーキテクチャを、1000 Genomesの集団遺伝学ワークフローおよびKubernetes上で動作するHyperflow WMSで実装し、評価します。150のクエリに対するアブレーション研究では、Skillsによって完全一致の意図精度が44%から83%へ向上します；スキル駆動の遅延型ワークフロー生成はデータ転送を92%削減します；そしてエンドツーエンドのパイプラインは、Kubernetes上でLLMオーバーヘッドが15秒未満、クエリあたりのコストが0.001ドル未満でクエリを完了します。