概要: 近年のエージェント型システムは、大規模言語モデルが自然言語から科学的可視化を生成できることを示しています。しかし、信頼性は依然として主要な制約です。システムが無効な操作を実行したり、微妙ではあるが重大な誤りを導入したり、入力が十分に特定されていない場合に不足している情報を要求し損ねたりする可能性があります。これらの問題は、しばしば標準ベンチマークを超える複雑さを持つ実世界のワークフローで増幅されます。したがって、自律型可視化パイプラインにおける信頼性の確保は、未解決の課題です。私たちは、複雑な科学的可視化ワークフローを自動化するための、信頼性が高く拡張可能なエージェント型フレームワークである TopoPilot を提案します。TopoPilot は、信頼性の高い動作を保証するための体系的なガードレールと検証メカニズムを組み込みます。主なユースケースとして位相データ解析と可視化に焦点を当てますが、このフレームワークは可視化領域全体にわたって一般化するよう設計されています。TopoPilot は、信頼性を中心に据えた2者エージェント構成を採用します。オーケストレーターエージェントがユーザープロンプトを、原子的なバックエンドアクションから構成されるワークフローへと変換し、一方の検証エージェントが実行前にこれらのワークフローを評価して、構造的な妥当性と意味論的な整合性を強制します。この解釈と検証の分離は、コード生成における誤りを減らし、正しさの保証を強制します。さらに、モジュール型アーキテクチャは、コンポーネントを分離し、コアシステムを変更することなく新しい記述子や領域固有のワークフローを容易に統合できるため、堅牢性を高めます。信頼性に体系的に取り組むために、失敗モードの分類体系を導入し、それぞれのクラスに対して狙いを定めたセーフガードを実装します。評価では、100のプロンプトに対して1,000のマルチターン会話をシミュレートし、敵対的で不可能な要求を含めた場合でも、TopoPilot は包括的なガードレールとチェックを欠くベースラインと比較して、成功率99%超を達成しています。
TopoPilot:位相データ解析および可視化のための信頼性の高い会話型ワークフロー自動化
arXiv cs.LG / 2026/3/27
💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- 本論文は、自然言語プロンプトから科学的可視化ワークフローを確実に自動化するためのエージェント型フレームワーク「TopoPilot」を提案し、無効な操作、見落とされがちな微細な誤り、過不足のある入力における不明確さの欠落といった問題に焦点を当てている。
- TopoPilotは、信頼性中心の二者(2-agent)アーキテクチャを用いる。オーケストレータがプロンプトを原子的なアクションのワークフローへと変換し、実行の前に検証者がワークフロー構造と意味的整合性を確認する。
- このフレームワークはモジュール化され拡張可能であり、位相データ解析/可視化の領域を超えて汎用化することを目指している。新しい記述子やドメイン固有のワークフローを、コアシステムを変更することなく統合できるようにしている。
- 頑健性を高めるため、著者らは失敗モードの分類法(タクソノミー)を定義し、各カテゴリの失敗に対して的を絞ったガードレール(安全柵)を実装している。
- 100種類のプロンプトに対する1,000件のマルチターン会話を用いたシミュレーション評価(敵対的要求や実行不可能な要求を含む)では、TopoPilotの成功率は99%超であるのに対し、包括的な検証を欠くベースラインの成功率は50%未満と報告している。
広告
![[Boost]](/_next/image?url=https%3A%2F%2Fmedia2.dev.to%2Fdynamic%2Fimage%2Fwidth%3D800%252Cheight%3D%252Cfit%3Dscale-down%252Cgravity%3Dauto%252Cformat%3Dauto%2Fhttps%253A%252F%252Fdev-to-uploads.s3.amazonaws.com%252Fuploads%252Fuser%252Fprofile_image%252F3618325%252F470cf6d0-e54c-4ddf-8d83-e3db9f829f2b.jpg&w=3840&q=75)
