OpenClaw と Codex における軌道（トラジェクトリ）安全性評価・診断のためのベンチマーク：ATBench-Claw と ATBench-CodeX

arXiv cs.AI / 2026/4/17

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

共有:

要点

ATBenchは、軌道レベルでエージェントの安全性を評価・診断するためのベンチマークとして提示され、多様な実行環境に対して現実的であることを目指している。
本論文では、ATBenchをOpenClawおよびOpenAI Codex / Codex-runtimeの領域へ拡張する2つのドメイン別カスタム拡張として、ATBench-ClawとATBench-CodeXを導入する。
中核となる適応手法は、各実行設定を分析して、リスク源・失敗モード・現実の害の3次元からなるSafety Taxonomyをカスタマイズし、そのタクソノミーに基づいてベンチマーク仕様を生成する点にある。
ATBench-Clawは、ツール、スキル、セッション、外部アクションを含むOpenClawに特有の実行チェーンに焦点を当て、ATBench-CodeXは、リポジトリ、シェル、パッチ、依存関係、承認、実行時ポリシ境界を扱う軌道を対象とする。
著者らは、エージェントのフレームワークはアーキテクチャ上は比較的安定していても、実行環境やプロダクト能力が急速に変わり得るため、この拡張性が重要だと主張している。