プライバシーに配慮したアイデンティティ認識のための強化学習ガイドによる合成データ生成

arXiv cs.CV / 2026/4/10

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、規制や著作権の制約により実データへのアクセスが限られるプライバシーに配慮したアイデンティティ認識タスクを支援するための、強化学習ガイド付き合成データ生成フレームワークを提案する。
一般領域で学習済みの生成モデルを、対象のアイデンティティ認識領域へ整合させるためのコールドスタート適応ステップを用い、意味的な関連性と初期のサンプル忠実度を改善する。
本手法は、意味的一貫性、カバレッジの多様性、表現の豊かさのバランスをとる多目的の強化学習報酬を導入し、現実的でありながらタスクに有効な合成アイデンティティを生成する。
下流タスクの学習のために、動的なサンプル選択を追加し、高い有用性を持つ合成サンプルを優先することで、適応的なデータスケーリングと、小データ環境でのより良いドメイン整合を実現する。
ベンチマークデータセットでの実験により、生成忠実度と分類精度の両方が改善されることが示されており、限られたデータ下でも新しいカテゴリへの強い汎化が得られる。

Abstract

高忠実度の生成モデルは、規制や著作権の制約によりデータへのアクセスが厳しく制限されるプライバシーに敏感なシナリオで、ますます必要とされています。この希少性は、皮肉にも、生成モデルが最も必要とされるのにデータの不足を補う必要がある状況において、モデル開発を妨げます。これにより自己強化的な課題が生まれます。つまり、データが限られていると生成モデルの品質が低下し、その結果としてデータ不足を緩和できなくなります。このサイクルを断ち切るために、本研究では、一般ドメインの生成的事前知識をプライバシーに敏感な個人識別タスクに適応させる、強化ガイド付き合成データ生成フレームワークを提案します。まず、事前学習済みの生成器を対象ドメインに整合させ、意味的な関連性と初期の忠実度を確立するためのコールドスタート適応を行います。次に、この基盤の上に、意味的一貫性、カバレッジの多様性、表現の豊かさを同時に最適化する多目的報酬を導入し、生成器が現実的でありながらタスクに有効なサンプルを生成できるよう導きます。下流側の学習では、さらに動的なサンプル選択メカニズムにより、高効用の合成サンプルを優先し、適応的なデータスケーリングとドメイン整合性の改善を可能にします。ベンチマークデータセットに対する広範な実験により、本フレームワークが生成の忠実度と分類精度の両方を大幅に向上させること、さらに少データ環境において新規カテゴリへの強い汎化性も示すことを確認しました。