爪と危険:オープンなエージェント型システムを信頼できるか?
arXiv cs.AI / 2026/3/30
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、オープンなエージェント型システム(LLMの計画+ツール+永続メモリ+委譲された実行)が、確率的な実行時の意思決定や不確実な環境によって、従来のソフトウェアとは本質的に異なるセキュリティ問題を引き起こすと論じる。
- 攻撃、ベンチマーク、防御、監査、および関連するエンジニアリング基盤にわたる50本の論文を統合し、オープンなエージェント型システムのセキュリティを分析するための6次元の分類法を提示する。
- セキュア・バイ・コンストラクション(構築時から安全)な「参照ドクトリン」と、エージェント基盤(プラットフォーム)のセキュリティ態勢を評価するための評価スコアカードを導入する。
- レビューでは、現状の研究は攻撃の性格付けやベンチマーク構築については比較的成熟している一方で、デプロイ制御、運用上のガバナンス、永続メモリの完全性、そして信頼できる能力(ケイパビリティ)の取り消しについては弱いと指摘する。
- 最終的に、本論文は、万一の侵害下でも管理可能・監査可能・そしてレジリエントであり続けるエージェント・エコシステムを構築するための、具体的なエンジニアリング課題を提示して結論づける。




