CIA:LLMベースのマルチエージェントシステムから通信トポロジを推論する

arXiv cs.AI / 2026/4/15

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、LLMベースのマルチエージェントシステムにおける通信トポロジが、制限の厳しいブラックボックス脅威モデルの下でも推論可能であり、プライバシーおよび知的財産のリスクにつながることを示す。
  • 中間エージェントの推論出力を引き出すための敵対的なクエリを用い、その後それらの間の意味的相関を学習する、新しいCommunication Inference Attack(CIA)を提案する。
  • 本手法は、グローバルバイアスの切り離しと、LLMによる弱教師あり学習に依存し、限られた観測可能情報から推論精度を向上させる。
  • 通信トポロジを最適化したMASシステムでの実験では強い性能が示され、平均AUCは0.87、ピークAUCは最大0.99であった。これにより、本攻撃が基盤となる通信構造を確実に復元できることが示唆される。

Abstract

LLMベースのマルチエージェントシステム(MAS)は、複雑なタスクを解決する上で目覚ましい能力を示してきました。MASにおいて中核となるのは、エージェント同士が内部でどのように情報を交換するかを規定する通信トポロジです。そのため、通信トポロジのセキュリティには、ますます注目が集まっています。本論文では、重大なプライバシーリスクを調査します。すなわち、MASの通信トポロジは、制約の強いブラックボックス環境下でも推論可能であり、システムの脆弱性を露呈するとともに、知的財産に対して重大な脅威をもたらし得るという点です。このリスクを探るために、Communication Inference Attack(CIA)を提案します。これは、新たな敵対的クエリを構築して、中間エージェントの推論出力を誘発し、さらに提案するグローバルバイアスの非絡み(disentanglement)とLLMによる弱い教師あり学習(weak supervision)を通じて、それらのセマンティックな相関をモデル化する新しい攻撃です。最適化された通信トポロジを備えるMASに対する大規模な実験により、CIAの有効性が示されました。平均AUCは0.87、最大AUCは最大0.99を達成し、それによってMASにおける実質的なプライバシーリスクが明らかになりました。