2026 · 05 · 22 · 金

5/22 のアップデート

今朝は AI エージェントの安全設計まわりで、公式のチェックリストと CI テストツールが揃った話が届いています。「三本柱は知ってるけど抜け漏れが不安」という段階から、OWASP の 10 項目と RAMPART で実際にカバーできているかを確認できる環境が整ってきました。

A · Theme of the day

エージェントの安全設計、標準と自動検証が揃う

AI エージェントの安全設計に、OWASP 公式リストと Microsoft 製 CI ツールが揃ってきた週です。

エージェント設計、OWASP が初の公式チェックリストを出す

AI エージェントの権限設計
何が起きたか

三本柱を自己流で組むと抜け漏れが出やすい。OWASP は 2025 年 12 月、自律型 AI エージェントに特化した初の公式リスク分類「Top 10 for Agentic Applications」(ASI01〜ASI10)を公開した。目標ハイジャック・ツールの誤用・身元と特権の悪用・サプライチェーン侵害・予期しないコード実行・メモリ汚染・エージェント間通信の不備・カスケード障害・人間とエージェントの信頼の悪用・ならず者エージェントの 10 項目からなり、チャットボットやコパイロットではなく「計画し・ツールを使い・自律行動するエージェント」固有の脅威を体系化している。本記事の最小権限は「身元と特権の悪用」、サンドボックスは「ツールの誤用・予期しないコード実行」、人間承認は「人間とエージェントの信頼の悪用」にそれぞれ対応するため、設計レビューのチェックリストとして使うとよい。

以前との違い

先月まで、AI エージェントの権限設計は「最小権限・サンドボックス・人間承認の三本柱を自己流で実装してください」が業界の共通理解でした。MCP が普及した 2025 年以降、扱えるツール数が増えた分だけリスクも広がりましたが、「どの脅威に対処できているか」を体系的に確認する公式リストがなかった。OWASP は 2025 年 12 月に ASI01〜ASI10 を公開しており、今回の記事でその三本柱への対応関係が整理されました。

なぜ重要か

エージェントを本番に動かしている開発チームや、社内への AI 導入を進めているマネージャーには、設計レビューのチェックリストとして使えます。三本柱に何が欠けているかを確認するときに、OWASP の 10 項目と突き合わせるのが一番早いはずです。まだ PoC 段階でエージェントを本番に置いていないチームには今すぐ必要ではないです。ただ「本番に上げるとき何が必要か」を先に把握しておく意味では読んでおいて損はない資料です。

RAMPART、エージェントの安全性を CI で自動検証できるように

AI エージェントの権限設計
何が起きたか

設計したら終わりではなく、確率的に振る舞うエージェントには継続的な検証も要る。Microsoft は 2026 年 5 月、エージェント型 AI のレッドチーミングを CI/CD パイプラインに組み込む pytest フレームワーク「RAMPART」と、実装前に要件と失敗パターンを洗い出す相談役エージェント「Clarity」をオープンソース公開した。RAMPART は「このアクションは少なくとも 80% の実行で安全」といった統計的ポリシーを検証でき、権限設計が実装後も崩れていないかを自動でチェックできる。

以前との違い

ここ半年で AI エージェントは本番に届くようになってきましたが、「設計した権限が実装後も崩れていないか」を継続的に確認する仕組みはほぼ個別実装に頼っていました。手動のレッドチーミングは時間がかかり、毎回のデプロイには追いつかない。pytest のような感覚でエージェントの安全性テストを CI/CD に組み込める公式ツールは存在していませんでした。Microsoft が今月オープンソースで公開した RAMPART が、その空白を埋めます。

なぜ重要か

CI/CD でエージェントをデプロイしているエンジニアには、権限設計が「気づいたら崩れていた」を発見する手段が増えます。「80% の実行で安全」のような確率的な条件をテストで表現できる点が、従来のユニットテストと根本的に異なります。一緒に公開された Clarity は実装前の設計相談に使えますが、まだ出たばかりなので実運用への採用は様子見でいいかもしれません。個人プロジェクトや小規模チームには少し重いかも。

Archive

過去のアップデート

サイトに反映された変更を日次でアーカイブしています。