STAND:リモートセンシング画像の変化キャプション生成におけるセマンティック・アンカリング制約とデュアル粒度の曖昧性解消
arXiv cs.CV / 2026/4/28
📰 ニュースModels & Research
要点
- 本論文は、視点・スケール・事前知識における曖昧さを明示的に扱う、新しいリモートセンシング画像変化キャプション生成手法STANDを提案している。
- STANDは段階的に問題を解消し、解釈可能な制約によって時間的表現を正則化することで、信頼できる特徴基盤を作る。
- デュアル粒度の曖昧性解消モジュールでは、視点の混同にはマクロ(大域)文脈集約、微小物体のスケールにはミクロ(局所)で周波数を再焦点化した注意を組み合わせる。
- 最後に、セマンティック・コンセプト・アンカリング・モジュールが言語のカテゴリ事前分布を活用し、復号時の知識曖昧性を低減することで、広範な実験で従来法より優れていることが示されている。



