マルチエージェントシステムにおける失敗原因帰属の再考:マルチ視点ベンチマークと評価
arXiv cs.AI / 2026/3/27
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 既存のマルチエージェントシステム(MAS)の失敗原因帰属ベンチマークや手法は、複雑なエージェント間依存や曖昧な実行経路により、実際の失敗では複数のもっともらしい帰属が生じうるにもかかわらず、しばしば単一の決定論的な根本原因を前提としている。
- 本論文は、「単一の最良」な説明に無理に収束させるのではなく、帰属の曖昧性を明示的にモデル化するマルチ視点の失敗原因帰属パラダイムを提案する。
- MASにおけるマルチ視点の失敗原因帰属のために特化した、新しいベンチマークおよび評価プロトコルとしてMP-Benchを導入する。
- 実験の結果、LLMが失敗原因帰属を苦手とするという先行主張は、主に先行ベンチマーク設計の不備によって引き起こされていたことが示され、新しいマルチ視点の設定によってより現実的な結論が得られる。
- 著者らは、MASのデバッグや信頼性向上には、誤解を招く評価を避けるためにマルチ視点のベンチマークと評価プロトコルが必要だと主張する。
広告




