FlowHijack:フローマッチング視覚-言語-行動モデルに対する力学(ダイナミクス)対応のバックドア攻撃

arXiv cs.CV / 2026/4/14

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、フローマッチング視覚-言語-行動(VLA)モデルにおける、連続的なベクトル場(力学)によるアクション生成メカニズムに着目した、これまで未調査だったバックドア脆弱性を特定する。
  • 「FlowHijack」は、自己回帰的な離散化VLAモデルに対する攻撃に依存するのではなく、基盤となる力学を直接狙うことを目的とした最初のフレームワークである。
  • FlowHijackは、アクション生成の初期段階を操作するための「τ条件付き注入」戦略と、悪意のある振る舞いを通常の運動パターンに整合させ続けるための「力学模倣(dynamics-mimicry)正則化子」を用いる。
  • 実験では、ステルス性が高く状況に応じたトリガーにより高い攻撃成功率が報告されており、良性タスク性能は維持され、悪意あるアクションは正当なものと行動的に区別できない形で生成される。
  • これらの結果は、連続的な身体化モデルが重大なセキュリティリスクを持つことを示唆しており、内部の生成ダイナミクスに焦点を当てた防御の開発を後押しする。

Abstract

Vision-Language-Action(VLA)モデルはロボティクスの中核として台頭しており、pi_0 のようなフローマッチング・ポリシーは、滑らかで連続的なアクションを生成する上で大きな期待が寄せられています。これらのモデルが進化するにつれて、その独自のアクション生成メカニズム――ベクトル場ダイナミクス――は、特にバックドアの脆弱性において、重大かつ未解明のセキュリティ脆弱性をもたらす可能性があります。既存の、自己回帰的離散化を前提としたVLA向けのバックドア攻撃は、この新しい連続ダイナミクスには直接適用できません。私たちは、フローマッチングVLAの基盤となるベクトル場ダイナミクスを体系的に標的とする最初のバックドア攻撃フレームワークである FlowHijack を提案します。提案手法は、アクション生成の初期位相を操作する新規の tau 条件付き注入戦略と、ダイナミクス模倣正則化器を組み合わせます。実験により、FlowHijack は、先行研究が失敗した状況で、ステルス性の高い文脈に応じたトリガーを用いることで高い攻撃成功率を達成することを示します。重要なのは、良性タスクの性能を損なわず、運動学的類似性を強制することで、通常のアクションと行動的に見分けがつかない悪意あるアクションを生成できる点です。本研究の結果は、連続的な身体化モデルにおける重大な脆弱性を明らかにし、モデル内部の生成ダイナミクスを対象とする防御の緊急性を浮き彫りにします。