都市建設の変化モニタリングにおけるUAV:新たなベンチマークとチェンジキャプション生成モデル
arXiv cs.CV / 2026/5/7
📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research
要点
- この論文は、リモートセンシング画像の変化キャプション生成に取り組み、二値の変化マスクから、時系列のシーン変化を空間的に根拠づけた意味レベルの自然言語記述へと拡張することを目指しています。
- PTNetという提案手法は、構造化された変化のセマンティクスを明示的に扱い、変化検出の事前情報をキャプション生成に組み込むことで、「検出された変化」と「生成される文」の整合性を高めます。
- PTNetは、学習可能なプロトタイプバンクによる時系列間相互作用、マルチヘッドのゲーティングでタスク別表現を分離、さらにキャプション生成時に検出由来の空間事前情報を注入することで、微細な空間感度を保ちながら意味対応を確保します。
- 著者らは、都市の建設モニタリングに焦点を当てたUAVベースの大規模ベンチマークUCCDを新たに構築し、高解像度の9,000組のバイテンポラル画像と45,000の注釈付き文を提供します。
- UCCDおよびWHU-CDCでの実験では、PTNetが既存手法を一貫して上回り、データセットとコードはいずれも公開されています。




