PrivHAR-Bench: A Graduated Privacy Benchmark Dataset for Video-Based Action Recognition

arXiv cs.CV / 4/2/2026

📰 NewsSignals & Early TrendsIdeas & Deep AnalysisTools & Practical UsageModels & Research

Key Points

  • PrivHAR-Benchは、ビデオによるAction Recognitionに対して「プライバシー強度」と「認識精度」の関係を段階的に測るための、マルチティア型ベンチマークデータセットを提案しています。
  • ベンチマークは、軽量な空間的な隠蔽から暗号的なブロック順列までを含む段階的プライバシー変換を9ティアに分け、各ティアで1,932本の元動画を配布する設計になっています。
  • 人の動きによる性能への寄与を切り分けるため、背景除去バリアントや、損失なしフレーム系列、1フレームごとの境界ボックス、関節レベルの信頼度付き推定ポーズキーポイント等の付帯情報も提供されます。
  • 提供する評価ツールキットにより、R3D-18を用いた実験ではクリア映像88.8%から(背景除去を含む暗号化条件で)53.5%まで精度が低下し、さらにクロスドメインでは4.8%まで大きく崩れるなど、劣化曲線を解釈可能に示しています。
  • データセット生成パイプラインと評価コードが公開され、プライバシー/ユーティリティ比較の標準化を促すことが狙いです。

Abstract

Existing research on privacy-preserving Human Activity Recognition (HAR) typically evaluates methods against a binary paradigm: clear video versus a single privacy transformation. This limits cross-method comparability and obscures the nuanced relationship between privacy strength and recognition utility. We introduce \textit{PrivHAR-Bench}, a multi-tier benchmark dataset designed to standardize the evaluation of the \textit{Privacy-Utility Trade-off} in video-based action recognition. PrivHAR-Bench applies a graduated spectrum of visual privacy transformations: from lightweight spatial obfuscation to cryptographic block permutation, to a curated subset of 15 activity classes selected for human articulation diversity. Each of the 1,932 source videos is distributed across 9 parallel tiers of increasing privacy strength, with additional background-removed variants to isolate the contribution of human motion features from contextual scene bias. We provide lossless frame sequences, per-frame bounding boxes, estimated pose keypoints with joint-level confidence scores, standardized group-based train/test splits, and an evaluation toolkit computing recognition accuracy and privacy metrics. Empirical validation using R3D-18 demonstrates a measurable and interpretable degradation curve across tiers, with within-tier accuracy declining from 88.8\% (clear) to 53.5\% (encrypted, background-removed) and cross-domain accuracy collapsing to 4.8\%, establishing PrivHAR-Bench as a controlled benchmark for comparing privacy-preserving HAR methods under standardized conditions. The dataset, generation pipeline, and evaluation code are publicly available.