ILION: エージェント性を持つAIシステムの決定論的事前実行セーフティゲート

arXiv cs.AI / 2026/3/17

📰 ニュースDeveloper Stack & InfrastructureModels & Research

共有:

要点

ILIONは、トレーニングやラベル付きデータを必要とせずに、BLOCKまたはALLOWを決定するエージェント性を持つAIシステム向けの決定論的な事前実行セーフティゲートを導入します。
提案される行動を、その許可された範囲に基づいて分類するため、5つのコンポーネントからなるカスケード（Transient Identity Imprint、Semantic Vector Reference Frame、Identity Drift Control、Identity Resonance Score、Consensus Veto Layer）を採用しています。
サブミリ秒以下のレイテンシで、完全に解釈可能な判定を提供し、ILION-Bench v2の結果としてF1 0.8515、精度 91.0%、偽陽性率 7.9%を報告します。
Lakera Guard、OpenAI Moderation API、Llama Guard 3の3つのベースラインをF1スコアで4.3ポイント上回り、約2000倍の高速化を実現し、偽陽性率を4分の1に削減します。
本研究は、既存のテキスト安全性ツールが実行時の安全性には適していないと主張し、自律エージェントにおける行動レベルのセーフガードの必要性を強調します。

要約: 自律AIエージェントが現実世界の行動を実行できるようになることは - ファイルシステム操作、API呼び出し、データベースの変更、金融取引 - 既存のコンテンツモデレーション基盤では対処されていない安全性リスクの一類を導入します。現在のテキストセーフティシステムは暴力、憎悪表現、性的内容などの危害カテゴリを対象として言語的内容を評価しますが、提案された行動がエージェントの許可された運用範囲内にあるかを評価するには設計上適していません。我々は ILION（Intelligent Logic Identity Operations Network）を提示します。これはエージェント型AIシステムの決定論的実行ゲートです。ILION は、Transient Identity Imprint (TII)、Semantic Vector Reference Frame (SVRF)、Identity Drift Control (IDC)、Identity Resonance Score (IRS)、Consensus Veto Layer (CVL) の五成分カスケードアーキテクチャを用いて、提案されたエージェントの行動を BLOCK または ALLOW と分類します。
統計的訓練や API 依存なしで。システムはゼロラベルデータを必要とせず、サブミリ秒未満のレイテンシで動作し、完全に解釈可能な判定を生成します。 ILION を ILION-Bench v2 で評価します。これは 380 のテストシナリオを八つの攻撃カテゴリにまたがる、39% の難易度の高い敵対的ケースと、ホールドアウト開発分割を含む、目的別に作られたベンチマークです。 ILION は F1 = 0.8515、precision = 91.0%、偽陽性率は 7.9%、平均レイテンシは 143 マイクロ秒で達成します。 Lakera Guard（F1 = 0.8087）、OpenAI Moderation API（F1 = 0.1188）、Llama Guard 3（F1 = 0.0105）の三つのベースラインとの比較評価は、既存のテキストセーフティ基盤が根本的なタスク不一致のためエージェント実行の安全性タスクで体系的に失敗することを示しています。 ILION は最高の商用ベースラインを 4.3 F1 ポイント上回り、動作は 2,000 倍高速、偽陽性率は4分の1以下に低下します。

返却形式: {"translated": "翻訳されたHTML"}

【AIニュース】SBGなど、米で80兆円データセンター計画【日経新聞、読売新聞】

note

提言：CAFという“型”で成功の再現性を高める

日経XTECH

Llama 3.1 8B と CrewAI を用いて、私の RTX 5070 Ti 上で100% ローカルに動作する自律的なAI裁判所を構築しました。エージェント同士は文脈に基づく協力を通じて互いに議論します。

Reddit r/LocalLLaMA

次世代LLM推論技術: Flash-MoE から Gemini Flash-Lite、そしてローカルGPU活用へ

Dev.to

オープンソースAIの波とセキュリティへの投資: Qwen、Microsoft、Google の動向

Dev.to

ILION: エージェント性を持つAIシステムの決定論的事前実行セーフティゲート

要点

関連記事

【AIニュース】SBGなど、米で80兆円データセンター計画【日経新聞、読売新聞】

提言：CAFという“型”で成功の再現性を高める

Llama 3.1 8B と CrewAI を用いて、私の RTX 5070 Ti 上で100% ローカルに動作する自律的なAI裁判所を構築しました。エージェント同士は文脈に基づく協力を通じて互いに議論します。

次世代LLM推論技術: Flash-MoE から Gemini Flash-Lite、そしてローカルGPU活用へ

オープンソースAIの波とセキュリティへの投資: Qwen、Microsoft、Google の動向

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer