BeSafe-Bench: 機能的環境における状況依存エージェントの行動安全リスクを解明する

arXiv cs.AI / 2026/3/30

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文では、低忠実度シミュレーションや狭いタスクではなく、機能的（高忠実度）環境で動作する状況依存エージェントの行動安全リスクを明らかにするための新しいベンチマーク BeSafe-Bench（BSB）を提案する。
BSBは4つの領域――Web、Mobile、Embodied VLM、Embodied VLA――をカバーし、タスクに対して安全性に関わるリスクの9つのカテゴリを追加することで、指示（インストラクション）セットを拡張する。
ルールベースのチェックと、LLMを「判断者（judge）」として用いた推論を組み合わせるハイブリッド評価手法を用い、エージェントが実環境の結果にどのような影響を与えるかを評価する。
13の人気エージェントをテストしたところ、憂慮すべき傾向が見られる。すなわち、最良のエージェントでさえ安全制約を完全に満たしながらタスクを完了できるのは40%未満であり、高いタスク成功率はしばしば重大な安全違反と結びつく。

Abstract

大規模マルチモーダルモデル（LMM）の急速な進化により、エージェントは複雑なデジタルおよび物理タスクを遂行できるようになりました。しかし、これらを自律的な意思決定者として導入することは、大きな意図しない行動の安全性リスクをもたらします。一方で、包括的な安全性ベンチマークが存在しないことが主要なボトルネックとなっています。既存の評価は、低忠実度の環境、シミュレートされたAPI、あるいは狭い範囲に限定されたタスクに依存しているためです。このギャップに対処するために、本論文では BeSafe-Bench（BSB）を提案します。これは、機能的な環境に配置されたエージェントの行動に起因する安全性リスクを顕在化させるためのベンチマークであり、4つの代表的な領域（Web、Mobile、Embodied VLM、Embodied VLA）をカバーします。機能的環境を用いて、安全性にとって重要なリスクの9つのカテゴリでタスクを拡張することで、多様な指示空間を構築し、ルールベースのチェックと、LLMを「裁定者（judge）」として用いる推論を組み合わせたハイブリッド評価フレームワークを採用して、実環境への影響を評価します。13の人気エージェントを評価した結果、憂慮すべき傾向が明らかになりました。すなわち、最も性能の高いエージェントでさえ、タスクの完遂率が40%未満であり、かつ安全制約を完全に遵守することができていないのです。また、タスク性能が高いことが、深刻な安全性違反と結び付くことがしばしば見られます。これらの知見は、現実の場でエージェント型システムを導入する前に、安全性整合性を改善することが急務であることを強く示しています。

💡 この記事が使われたインサイト

AIの最新ニュースをまとめた「今日の要点」で、この記事が取り上げられています。

📅 3/30Dailyインサイトを見る →

Black Hat Asia

AI Business

米国のデータセンター投資、オフィス超えへ AI急成長で建築の主役交代

日経XTECH

AIリテラシーをどう教えるか、自分事として考える知識創造理論の内面化

日経XTECH

ナトリウムイオン電池、中国圧倒も「日本に勝機ある」／ニコンやキヤノン抜き去ったASML、AI半導体時代の水平分業先取り

日経XTECH

AIはツールから「同僚」へ、メルカリは複数エージェントが意思疎通

日経XTECH

BeSafe-Bench: 機能的環境における状況依存エージェントの行動安全リスクを解明する

要点

Abstract

💡 この記事が使われたインサイト

関連記事

Black Hat Asia

米国のデータセンター投資、オフィス超えへ AI急成長で建築の主役交代

AIリテラシーをどう教えるか、自分事として考える知識創造理論の内面化

ナトリウムイオン電池、中国圧倒も「日本に勝機ある」／ニコンやキヤノン抜き去ったASML、AI半導体時代の水平分業先取り

AIはツールから「同僚」へ、メルカリは複数エージェントが意思疎通

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

Abstract

💡 この記事が使われたインサイト

関連記事

Black Hat Asia

米国のデータセンター投資、オフィス超えへ AI急成長で建築の主役交代

AIリテラシーをどう教えるか、自分事として考える 知識創造理論の内面化

ナトリウムイオン電池、中国圧倒も「日本に勝機ある」／ニコンやキヤノン抜き去ったASML、AI半導体時代の水平分業先取り

AIはツールから「同僚」へ、メルカリは複数エージェントが意思疎通

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

AIリテラシーをどう教えるか、自分事として考える知識創造理論の内面化