TornadoNet: 序数監督を用いたリアルタイム建物損傷検出
arXiv cs.CV / 2026/3/13
📰 ニュースIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- TornadoNetは、災害後の状況下でCNNベースのYOLO検出器とトランスフォーマー型RT-DETRを比較するリアルタイムかつ街路レベルの建物損傷ベンチマークを提示します。
- データセットは、2021年の中西部竜巻発生事象からの3,333枚の高解像度ジオタグ付き画像と8,890件の建物アノテーションを含み、IN-CORE損傷状態の5段階尺度を使用します。
- CNNのYOLOモデルは検出スループットとmAPでより高い値を達成します(A100上で66-276 FPS、mAP@0.5は最大46.05%)。一方、RT-DETRはより強い序数的一貫性を示します(Ordinal Top-1 88.13%、MAOE 0.65)。
- 本論文はソフトな序数ターゲットと明示的な序数距離ペナルティを提案します。校正済み序数監督を用いたRT-DETRは改善をもたらし(例:4.8ポイントのmAP向上、Ordinal Top-1 91.15%、MAOE 0.56)、GitHubに展開可能なツールを提供します。
Abstract: TornadoNetの包括的なベンチマークを提示します。現代のリアルタイム物体検出アーキテクチャと序数対応監督戦略が、現実的な災害後条件下でどのように機能するかを自動化された街路レベルの建物損傷評価を用いて評価します。TornadoNetは、建築設計と損失関数の設計が街路ビュー画像からの多段階損傷検出にどのように影響するかを、初めて統制されたベンチマークとして示し、災害対応のための方法論的洞察と展開可能なツールを提供します。2021年の中西部竜巻アウトブレイクからの3,333枚の高解像度ジオタグ付き画像と8,890件の建物アノテーションを用い、YOLOファミリのCNNベース検出器を、マルチレベル損傷検出のためのトランスフォーマーモデル(RT-DETR)と体系的に比較します。モデルは、IN-CORE損傷状態に基づく5段階の損傷分類フレームワークを用いた標準化されたプロトコルで訓練され、専門家によるクロスアノテーションによって検証されます。ベースライン実験は、相補的なアーキテクチャの強みを示します。CNNベースのYOLOモデルは最高の検出精度とスループットを達成し、より大きなバリアントはA100 GPU上で66-276 FPS、mAP@0.5で46.05%を達成します。トランスフォーマー系RT-DETRモデルは、序数的一貫性がより強く、Ordinal Top-1 Accuracyが88.13%、MAOEが0.65で、基準となるmAPが低いにもかかわらず深刻さの階層化の信頼性が高いことを示します。損傷の序数性という順序付けの性質に監督を合わせるため、ソフトな序数分類ターゲットを導入し、明示的な序数距離ペナルティを評価します。校正済み序数監督で訓練したRT-DETRは、44.70%のmAP@0.5を達成し、4.8ポイントの改善をもたらし、序数指標(Ordinal Top-1 Accuracy 91.15%、MAOE = 0.56)での利得も得られます。これらの知見は、序数対応の監督が検出器アーキテクチャと整合する場合に損傷深刻さ推定を改善することを示しています。Model & Data: https://github.com/crumeike/TornadoNet