エンコーダ型大規模言語モデルによるアトリビューション駆動の説明可能な侵入検知

arXiv cs.AI / 2026/4/10

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、SDNネットワークの侵入検知に向けて、エンコーダ型LLMの判断をより解釈可能にするためのアトリビューション駆動型アプローチを提案する。
  • フロー単位のトラフィック特徴を用いて、アトリビューション分析によってモデル出力を導くトラフィック行動パターンが明らかになることを示す。
  • 著者らは、学習された判断の要因が確立された侵入検知の原則に対応していると報告しており、LLMが意味のある攻撃ダイナミクスを捉えていることを示唆している。
  • 本研究は、アトリビューション手法を適用することで透明性と信頼性が向上し、セキュリティに重大な影響を持つ環境でのLLMのより実用的な導入を支援できると主張する。

要旨: ソフトウェア定義ネットワーキング(SDN)はネットワークの柔軟性を向上させる一方で、信頼性が高く解釈可能な侵入検知の必要性も増大させます。大規模言語モデル(LLM)は、強力な表現学習能力により、サイバーセキュリティのタスクに対して近年検討されてきました。しかし、その透明性の欠如は、セキュリティ上の重要性が高い環境での実用的な採用を制限しています。したがって、LLMがどのように意思決定を行うのかを理解することが不可欠です。本論文では、フローレベルのトラフィック特徴を用いたネットワーク侵入検知に対し、エンコーダ型LLMの帰属(attribution)駆動の分析を提示します。帰属分析により、モデルの意思決定が意味のあるトラフィック行動パターンによって導かれていることが示され、トランスフォーマー型SDN侵入検知における透明性と信頼が向上します。これらのパターンは、確立された侵入検知の原則と一致しており、LLMがトラフィックのダイナミクスから攻撃行動を学習していることを示唆します。本研究は、LLMベースのセキュリティ分析を検証し、信頼するうえでの帰属手法の価値を示します。