AI Navigate

LLMベースのエージェントに対する標的型ビット反転攻撃

arXiv cs.AI / 2026/3/12

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • 著者らは、マルチステージパイプラインにおけるLLMベースのエージェントに特化した標的型ビット反転攻撃フレームワークFlip-Agentを提案する。
  • Flip-Agent は最終出力だけでなく、エージェントが実行するツールの呼び出し順序も操作できる。
  • 実験結果は、Flip-Agent が現実世界のエージェントタスクにおいて従来のBFAsを大きく上回ることを示しており、従来知られていたよりも強力な攻撃面を示唆している。
  • 本研究は、LLMベースのエージェントシステムにおける重大なセキュリティ脆弱性を明らかにし、耐障害性と防御戦略の強化を求めている。
要旨: 標的型ビット反転攻撃(BFA)は、ハードウェア故障を利用してモデルのパラメータを操作し、重大なセキュリティ脅威をもたらす。これまでの研究は単一ステップの推論モデル(例:画像分類器)を対象とする一方で、マルチステージパイプラインと外部ツールを備えたLLMベースのエージェントは新たな攻撃面を呈するが、未開拓のままである。本研究は、LLMベースのエージェント向けの初の標的型BFAフレームワークであるFlip-Agentを紹介し、最終出力とツール呼び出しの両方を操作する。実験の結果、Flip-Agent は現実世界のエージェントタスクにおいて既存の標的型BFAを大幅に上回ることを示し、LLMベースのエージェントシステムにおける重大な脆弱性を明らかにしている。