デスクトップGUIエージェントにおけるUI状態不整合:コンピューター利用型エージェントへのTOCTOU攻撃に対する形式化と防御
arXiv cs.AI / 2026/4/22
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- スクリーンショットとクリックのループに依存するデスクトップGUIエージェントは、観測から行動までのギャップにより、攻撃者が悪用できるTOCTOU型の脆弱性ウィンドウを生み出します。
- 本論文では問題を「視覚的原子性違反」として形式化し、通知オーバーレイのハイジャック、ウィンドウのフォーカス操作、Web DOMインジェクションの3つの攻撃プリミティブを示します。
- ウィンドウのフォーカス操作では、観測時に視覚的な証拠が残らないままエージェントの行動を100%の成功率でリダイレクトできることが示されます。
- 提案されるPre-execution UI State Verification(PUSV)は、各アクション実行の直前にUI状態を再確認し、ターゲット周辺の画素レベルSSIM、スクリーンショット差分、X Windowスナップショット差分という層構造の検証を行います。
- PUSVは180件の敵対試験で100%のアクション遮断を達成し、誤検知ゼロかつ0.1秒未満のオーバーヘッドを示しますが、DOMインジェクション攻撃には盲点があることも明らかになり、OS+DOMのより多層的な防御が必要だと示唆されます。
関連記事

ChatGPTが『依存』だとユーザーを疑う件について
note

【AI×マインドフルネス】SUNO AIで挑む「朝の活力」4分間瞑想ガイド制作記
note

【note更新、嫌になってませんか】告知ゼロで19,860円の記事が累計3本売れた夜に、私が見ている世界規模の油田の話。あなたは今、石油を掘っている自覚はありますか? #生成AI #AI活用 #noteで読めるマンガ #ChatGPTImages2.0 #ChatGPT #Claude #Gemini #Kindle出版 #nanobanana #note #情報発信 #ビジネス #noteの書き方 #副業 #マーケティング
note

XのAI、Grok(グロク)と宇宙や構成のお話するよ。まずはグロクの性格から!
note

XのAI、Grok(グロク)と宇宙や構成のお話するよ。まずはグロクの性格から!
note