LogicPoison: グラフ検索拡張生成に対する論理的攻撃

arXiv cs.CL / 2026/4/6

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • GraphRAGは、ナレッジグラフに根拠づけて回答することでLLMの推論を改善し、テキスト汚染やプロンプトインジェクションのような従来型のRAG攻撃に対して耐性があるとしばしば見なされている。
  • 本論文は、GraphRAGのセキュリティはグラフのトポロジー/論理的な完全性に大きく依存しており、攻撃者は表面上のテキストを変えずにそれを改ざんできると主張する。
  • LogicPoisonという攻撃フレームワークを導入し、型(タイプ)を保持したエンティティの置換を用いて、グローバルな連結性(論理ハブ)と、クエリ固有のマルチホップ推論経路(推論ブリッジ)の双方を破壊する。
  • 複数のベンチマークにわたる実験により、LogicPoisonは強い秘匿性をもってGraphRAGの防御を回避でき、最先端のベースラインと比べて性能を大幅に低下させることが示されている。
  • 著者らはLogicPoisonのオープンソース実装を提供しており、再現性とGraphRAGシステムのさらなるセキュリティ評価を可能にする。

要旨: グラフベースの検索拡張生成(GraphRAG)は、構造化知識グラフに基づいて応答を根拠づけることで、大規模言語モデル(LLM)の推論能力を高めます。コミュニティ検出や関係フィルタリングの手法を活用することで、GraphRAGシステムは、テキスト汚染やプロンプトインジェクションといった従来のRAG攻撃に対して、本質的に耐性があることが示されています。しかし本論文では、GraphRAGシステムのセキュリティが基盤となるグラフのトポロジー(位相的な整合性)に根本的に依存しており、表層レベルのテキスト意味論を変えずに、論理的な接続を暗黙的に破壊することで、その整合性が損なわれうることを見出します。この脆弱性を悪用するために、本稿では
\textsc{LogicPoison}を提案します。
\textsc{LogicPoison}は、誤った内容を注入するのではなく、論理推論を標的とする新しい攻撃フレームワークです。具体的には、
\textsc{LogicPoison}は、型を保持するエンティティの入れ替え機構を用いて、グローバルな論理ハブを攪乱し(グラフ全体の連結性を破壊するため)、さらに、クエリに固有な推論ブリッジを操作して(必須のマルチホップ推論パスを断つため)というように、両者に摂動を与えます。このアプローチは、表層レベルでのテキストのもっともらしさを維持したまま、有効な推論を行き止まりへと迂回させます。複数のベンチマークにわたる包括的な実験により、
\textsc{LogicPoison}がGraphRAGの防御を確実に回避し、性能を大きく低下させること、また有効性とステルス性の両面で最先端のベースラインを上回ることが示されます。コードは
the
\textcolor{blue}https://github.com/Jord8061/logicPoison で公開しています。