CO-EVO:分散型DG-ReIDにおける意味的アンカーの共進化とスタイル多様化

arXiv cs.LG / 2026/4/30

💬 オピニオンDeveloper Stack & InfrastructureModels & Research

要点

  • この論文は、プライバシーを保ったまま未見の対象環境へ一般化性能を高めるための、人物再識別向け連合学習ドメイン一般化(FedDG-ReID)フレームワーク「CO-EVO」を提案しています。
  • 分散クライアント間のスタイル差による課題に対し、カメラインバリアントな意味的アンカー(CSA)でカメラをまたぐ一貫した同一人物プロンプトを学習し、局所的な画像ノイズを除く意味的な精製を行います。
  • 視覚側では、グローバル・カメラ・スタイル・バンク(GCSB)を用いたグローバル・スタイル多様化(GSD)により、現実的な摂動を合成して学習データのスタイル境界を広げます。
  • CO-EVOの中核となる共進化ループでは、精製された意味的アンカーが重力中心のように働き、多様なスタイル変動下でも頑健な解剖学的属性(同一性に関わる特徴)へ画像エンコーダを導きます。
  • 実験ではSOTA(先端)性能が示され、意味的精製とスタイル拡張の相乗効果が頑健なクロスドメイン一般化に不可欠であることを主張しています。コードも公開されています。

Abstract

人物再識別のためのフェデレーテッドドメイン汎化(FedDG-ReID)は、分散した複数のソースドメインにまたがって歩行者検索モデルを協調的に学習し、生データのプライバシーを損なうことなく、見たことのないターゲット環境へと汎化できるようにすることを目的としています。しかし、この課題は分散したクライアント間に本質的に存在するスタイルのギャップによって大きく難しくなっています。グローバルな監督がない場合、モデルは容易にショートカット学習に陥り、普遍的なアイデンティティ特徴ではなく、ドメイン固有のカメラバイアスに表現が過適合してしまいます。私たちは、このセマンティック(意味)とスタイルの衝突を共進化的メカニズムによって解決する新しいフェデレーテッドフレームワークであるCO-EVOを提案します。セマンティック側では、カメラ不変セマンティックアンカリング(CSA)が、カメラをまたいだ一貫性を備えたアイデンティティ・プロンプトを学習し、局所的な撮像ノイズを除去する、浄化されたドメイン非依存のアンカーを確立します。視覚側では、グローバル・カメラ・スタイル・バンク(GCSB)により駆動されるグローバル・スタイル多様化(GSD)が、現実的な摂動を合成して、学習データの視覚的境界を拡張します。CO-EVOの中核は、浄化されたアンカーが重力の中心として働き、多様なスタイル変動の中でも画像エンコーダを頑健な解剖学的属性へ導く共進化ループです。大規模な実験により、CO-EVOが先端(SOTA)の性能を達成し、セマンティックな浄化とスタイル拡張の相乗効果が頑健なクロスドメイン汎化に不可欠であることが示されます。コードは以下で公開しています: https://github.com/NanYiyuzurn/ACL-LGPS-2026。