視覚的手がかりを超えて:セマンティック駆動のトークンフィルタリングとエキスパートルーティングによるいつでも人物ReID
arXiv cs.CV / 2026/4/17
📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research
要点
- 本論文は、RGB/IR間の大きなモダリティシフトや大幅な衣服変化に対応する「いつでも人物再識別(AT-ReID)」向けに、STFER(Semantic-driven Token Filtering and Expert Routing)を提案する。
- STFERは、大規模なビジョン・言語モデル(LVLM)を用いて、アイデンティティの一貫性を表す意味テキストを生成し、衣服差やモダリティ差に頑健な識別特徴を得る。
- この意味テキストは2つの仕組みに活用される:SVTF(Semantic-driven Visual Token Filtering)で情報量の多い視覚領域を強調し背景ノイズを抑制し、SER(Semantic-driven Expert Routing)でマルチシナリオのゲーティングをより頑健にする。
- AT-USTCデータセットでの実験により最先端(SOTA)性能が示され、さらにAT-USTCで学習したモデルが5つの主要ReIDベンチマークへ高い汎化性能を示した。
- 著者らは、コードを近日公開予定であると述べている。




