因果ブートストラップ整合による教師なし・動画ベース可視-赤外人物再識別
arXiv cs.CV / 2026/4/20
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、全天候の監視を想定した教師なしの可視–赤外人物再識別(VVI-ReID)を、ラベルなしの動画トラックレットから学習することで実現しようとし、教師あり手法で必要となる高コストなクロスモダリティ注釈を回避することを目的としています。
- 画像ベースの教師なしVI-ReIDをそのまま動画設定に拡張し、汎用の事前学習エンコーダを用いるだけでは、アイデンティティ識別力の弱さとモダリティバイアスの強さによって性能が低下することを示しています。
- これらの課題に対して提案するCausal Bootstrapped Alignment(CBA)では、Causal Intervention Warm-up(CIW)により、モダリティや動きが生む見かけ上の相関を抑えつつ、アイデンティティに関わる意味は保持するように設計しています。
- さらにPrototype-Guided Uncertainty Refinement(PGUR)として、可視と赤外のクラスター粒度の不一致を扱うために、信頼できる可視プロトタイプを不確実性を考慮した監督とともにガイドしながら、粗いから細かいへと進めるクロスモダリティ整合を行います。
- HITSZ-VCMおよびBUPTCampusでの実験では、CBAが教師なし動画VVI-ReID設定に拡張した場合に、既存の教師なしVI-ReID手法を大きく上回ることが示されています。



