OpenClaw と Codex における軌道(トラジェクトリ)安全性評価・診断のためのベンチマーク:ATBench-Claw と ATBench-CodeX
arXiv cs.AI / 2026/4/17
📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research
要点
- ATBenchは、軌道レベルでエージェントの安全性を評価・診断するためのベンチマークとして提示され、多様な実行環境に対して現実的であることを目指している。
- 本論文では、ATBenchをOpenClawおよびOpenAI Codex / Codex-runtimeの領域へ拡張する2つのドメイン別カスタム拡張として、ATBench-ClawとATBench-CodeXを導入する。
- 中核となる適応手法は、各実行設定を分析して、リスク源・失敗モード・現実の害の3次元からなるSafety Taxonomyをカスタマイズし、そのタクソノミーに基づいてベンチマーク仕様を生成する点にある。
- ATBench-Clawは、ツール、スキル、セッション、外部アクションを含むOpenClawに特有の実行チェーンに焦点を当て、ATBench-CodeXは、リポジトリ、シェル、パッチ、依存関係、承認、実行時ポリシ境界を扱う軌道を対象とする。
- 著者らは、エージェントのフレームワークはアーキテクチャ上は比較的安定していても、実行環境やプロダクト能力が急速に変わり得るため、この拡張性が重要だと主張している。




