ComPrivDet: 推論再利用により圧縮ドメインで効率的にプライバシー対象を検出する手法

arXiv cs.CV / 2026/4/7

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • ComPrivDetは、IoTの動画でプライバシー対象(顔やナンバープレート)を圧縮ドメインのまま効率的に検出する手法として提案されています。
  • Iフレームの推論結果を再利用し、圧縮領域の手がかりから「新しい対象の有無」を判断してP/Bフレームの検出をスキップまたは軽量検出器で補正します。
  • 実験では、顔検出で99.75%の精度、ナンバープレート検出で96.83%の精度を維持しつつ、80%以上の推論をスキップできると報告されています。
  • 既存の圧縮ドメイン検出法に比べて、平均で精度が9.84%向上し、レイテンシは75.95%低減したとされています。

Abstract

モノのインターネット(IoT)が日常生活に深く組み込まれるにつれて、ユーザはプライバシー漏えい、特に映像データからの漏えいをますます懸念するようになっています。大規模な映像解析(例:スマートコミュニティ)におけるフレームごとの保護は大きな遅延をもたらすため、より効率的な解決策は、プライバシー対象(例:顔)を含むフレームだけを選択的に保護することです。既存の物体検出器は、完全に復号された動画、または圧縮動画におけるフレームごとの処理を必要とするため、復号のオーバーヘッドが発生したり、精度が低下したりします。そこで本研究では、Iフレームの推論結果を再利用することで、圧縮動画においてプライバシー対象を検出する効率的な手法であるComPrivDetを提案します。圧縮ドメインの手がかりにより新しい対象の存在を特定することで、ComPrivDetはPフレームおよびBフレームの検出をスキップするか、軽量な検出器でそれらを効率よく改良します。ComPrivDetは、推論の80%以上をスキップしつつ、プライベートな顔検出で99.75%の精度、プライベートなナンバープレート検出で96.83%の精度を維持します。既存の圧縮ドメイン検出手法と比較して平均9.84%高い精度を達成し、平均75.95%低いレイテンシを実現します。