PLUME: プロトコル認識トークン化を用いた無線トレースのためのネットワークネイティブ基盤モデルの構築

arXiv cs.LG / 2026/3/17

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • Plumeは、PDMLディセクションを用いた構造化無線トレース(802.11)からの学習を特化して設計された新しい140Mパラメータの基盤モデルです。
  • プロトコル認識トークナイザーを導入し、ディセクターフィールドツリーに沿ってトークン化し、タイミング間隔トークンを挿入し、識別子を正規化することで、シーケンス長を約6.2x短縮し、トークンあたりの密度を高めます。
  • 実データでの評価では、Plumeは5つの異常カテゴリに対して次パケットのトークン精度を74〜97%、ゼロショット異常検知のAUROCを0.99以上で達成します。
  • Claude Opus 4.6およびGPT-5.4といったフロンティアLLMsは、同一のプロトコルコンテキストが与えられれば同等の結果を達成しますが、Plumeはパラメータ数を600倍以上抑え、単一GPUで実行可能でほぼ追加クラウド費用ゼロの条件を提供するため、オンプレミスでのプライバシー保護付き根本原因分析を実現します。
  • 本研究は、ネットワークネイティブ基盤モデルの実現可能性を示し、ネットワークのデバッグおよびセキュリティワークフローにおける潜在的な下流の利点を示唆します。

要約: 基盤モデルは、モダリティのネイティブな構造で学習する場合に成功します。言語の形態を尊重するトークンであれ、視覚のピクセルであれ、意味は平坦な文字列から生まれるのではなく、階層化されたヘッダ、型付きフィールド、タイミングのギャップ、そしてパケット間の状態機械から生じます。私たちは Plume (Protocol Language Understanding Model for Exchanges) を提示します。802.11 トレースのためのコンパクトな 1億4000万パラメータの基盤モデルで、構造化 PDML の分解から学習します。プロトコル対応のトークナイザはディセクター・フィールド・ツリーに沿って分割し、タイミングのギャップトークンを出力し、識別子を正規化することで、BPE より 6.2 倍短いシーケンスを実現し、トークンあたりの情報密度を高めます。厳選されたコーパスで訓練された Plume は、現実世界の 5 つの故障カテゴリにわたり、次パケットトークン精度を 74–97%、ゼロショット異常検知の AUROC が 0.99 以上を達成します。同じ予測タスクにおいて、最先端の LLM(Claude Opus 4.6、GPT-5.4)は、同一プロトコルコンテキストを受け取っても同等のスコアを示しますが、Plume は 600x 以上少ないパラメータでこれを実現し、単一の GPU に収まり、クラウド API の価格と比較して実質的に追加コストゼロで、オンプレミス、プライバシー保護付き根本原因分析を可能にします。

広告