基盤モデル時代におけるAIセキュリティ:統一的視点からの包括的サーベイ
arXiv cs.AI / 2026/3/27
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、機械学習(ML)におけるセキュリティ研究が断片化しすぎており、攻撃と防御を共有の枠組みの中で捉えるのではなく、互いに独立したものとして扱ってきたと主張する。
- 基盤モデルの設定では、データとモデルが密接に結び付けられているため、片方の脆弱性が他方を直接的に損なう可能性があることを強調する。
- 著者らは、モデルとデータの相互作用を4つの方向軸で捉える統一的なクローズドループ型の脅威分類法を提案する:Data→Data、Data→Model、Model→Data、Model→Model。
- 各カテゴリには、データの復号やウォーターマーク除去、ポイズニングやジェイルブレイク、モデルの反転やメンバーシップ推定、モデル抽出などの具体的な脅威タイプが対応付けられる。
- 本フレームワークは、基盤モデルに対するスケーラブルで転用可能かつクロスモーダルなセキュリティ戦略を開発するための基盤として提示される。
広告




