ARMOR 2025：民間文脈を超えた大規模言語モデルの安全性を評価するための軍事連携型ベンチマーク

arXiv cs.AI / 2026/5/4

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、防衛用途で求められる「民間向けの一般的なリスク」だけではなく、軍事文脈に即した安全性評価を行うための大規模言語モデル向けベンチマーク「ARMOR 2025」を提案する。
ARMOR 2025は、戦争法（Law of War）、交戦規則（Rules of Engagement）、統合倫理規程（Joint Ethics Regulation）という3つの軍事ドクトリンに基づき、各ルールの意図を保った多肢選択式の質問を作成する。
ベンチマークはOODA（Observe–Orient–Decide–Act）意思決定フレームワークに基づく分類（タクソノミー）で整理され、軍事に関連する意思決定タイプごとに精度と拒否（refusal）を体系的に検証できる。
21種類の商用LLMを対象に評価した結果、軍事向け意思決定支援における安全性アラインメントには重大なギャップが見つかった。
ARMOR 2025には12カテゴリの構造化タクソノミー、519件のプロンプト、厳密な評価手順が含まれており、法的・倫理的コンプライアンスをより現実的に評価することを可能にする。

Anthropic News

日経XTECH

The Verge

Dev.to

Dev.to