リアルタイムかつ効率的な天候属性検出のためのヒューリスティック・スタイル変換
arXiv cs.CV / 2026/4/16
📰 ニュースSignals & Early TrendsModels & Research
要点
- 本論文は、RGB画像から天候タイプ(晴れ、雨、雪、霧)を検出し、さらに11の追加の天候属性を予測するための、軽量でリアルタイムな深層学習アーキテクチャを提案する。マルチタスク出力により、合計53クラスを扱う。
- 「視覚的スタイルとしての天候」を探究し、グラム行列(自動化/ローカルのグラム計算を含む)、切り詰めたResNet-50特徴、PatchGAN風の識別器、マルチタスク枠組み内での注意(アテンション)といった、スタイルに触発された仕組みを適用する。
- 2つのモデルファミリ—RTM(ResNet50-Truncated-MultiTasks)およびPMG(PatchGAN-MultiTasks-Gram)—を導入する。PMGはローカルなスタイルの捉え方により、強い空間的整合性を示す。
- 報告されている結果では、内部性能が高い(F1 > 96%)ことに加え、外部データセットにおける意味のあるゼロショット転移も示される(F1 > 78%)。これは、学習分布を超えた一般化を示唆する。
- 著者らは大規模なCC-BYデータセット(503,875枚の画像と12の天候属性)を公開している。また、PMGモデルはパラメータ数が<5Mでメモリ使用量も少ないことを強調しており、タスクの追加/削除をモジュールとして扱えることで、組込みシステムへの展開を想定している。




