AI Navigate

RandMark: 視覚的ファウンデーションモデルのランダム透かし付与について

arXiv cs.CV / 2026/3/12

📰 ニュースModels & Research

要点

  • RandMarkは、小型のエンコーダ-デコーダネットワークを用いて内部表現にデジタル透かしを埋め込むことで、視覚的ファウンデーションモデルの所有権検証フレームワークを提案します。
  • 透かしはホールドアウトセットの入力画像に対してランダム埋め込みを用いるため、透かし統計量が透かし済みモデルの機能コピーに検出可能になります。
  • 理論的および実験的な結果は、非透かしモデルに対する偽陽性の確率が低く、透かしモデルに対する偽陰性の確率も低いことを示しています。
大規模で多様なデータセットで学習された視覚ファウンデーションモデル(VFMs)は、さまざまな下流のコンピュータビジョンタスクにおいて顕著な性能と効率を実現するよう微調整されることがあります。データ収集と訓練の高い計算コストは、これらのモデルを貴重な資産とし、知的財産権を保護するためにライセンスとともに配布される動機となります。本論文では、内部表現にデジタル透かしを埋め込むために小さなエンコーダ-デコーダネットワークを活用する、視覚ファウンデーションモデルの所有権検証アプローチを提案します。この方法は、ランダム透かし埋め込みに基づいており、透かし統計量が透かし済みモデルの機能コピーで検出可能になります。理論的にも実証的にも、提案手法は非透かしモデルに対する偽陽性の確率が低く、透かしモデルに対する偽陰性の確率も低いことを示しています。