TornadoNet: 序数監督を用いたリアルタイム建物損傷検出

arXiv cs.CV / 2026/3/13

📰 ニュースIdeas & Deep AnalysisTools & Practical UsageModels & Research

共有:

要点

TornadoNetは、災害後の状況下でCNNベースのYOLO検出器とトランスフォーマー型RT-DETRを比較するリアルタイムかつ街路レベルの建物損傷ベンチマークを提示します。
データセットは、2021年の中西部竜巻発生事象からの3,333枚の高解像度ジオタグ付き画像と8,890件の建物アノテーションを含み、IN-CORE損傷状態の5段階尺度を使用します。
CNNのYOLOモデルは検出スループットとmAPでより高い値を達成します（A100上で66-276 FPS、mAP@0.5は最大46.05%）。一方、RT-DETRはより強い序数的一貫性を示します（Ordinal Top-1 88.13%、MAOE 0.65）。
本論文はソフトな序数ターゲットと明示的な序数距離ペナルティを提案します。校正済み序数監督を用いたRT-DETRは改善をもたらし（例：4.8ポイントのmAP向上、Ordinal Top-1 91.15%、MAOE 0.56）、GitHubに展開可能なツールを提供します。

Abstract: TornadoNetの包括的なベンチマークを提示します。現代のリアルタイム物体検出アーキテクチャと序数対応監督戦略が、現実的な災害後条件下でどのように機能するかを自動化された街路レベルの建物損傷評価を用いて評価します。TornadoNetは、建築設計と損失関数の設計が街路ビュー画像からの多段階損傷検出にどのように影響するかを、初めて統制されたベンチマークとして示し、災害対応のための方法論的洞察と展開可能なツールを提供します。2021年の中西部竜巻アウトブレイクからの3,333枚の高解像度ジオタグ付き画像と8,890件の建物アノテーションを用い、YOLOファミリのCNNベース検出器を、マルチレベル損傷検出のためのトランスフォーマーモデル（RT-DETR）と体系的に比較します。モデルは、IN-CORE損傷状態に基づく5段階の損傷分類フレームワークを用いた標準化されたプロトコルで訓練され、専門家によるクロスアノテーションによって検証されます。ベースライン実験は、相補的なアーキテクチャの強みを示します。CNNベースのYOLOモデルは最高の検出精度とスループットを達成し、より大きなバリアントはA100 GPU上で66-276 FPS、mAP@0.5で46.05%を達成します。トランスフォーマー系RT-DETRモデルは、序数的一貫性がより強く、Ordinal Top-1 Accuracyが88.13%、MAOEが0.65で、基準となるmAPが低いにもかかわらず深刻さの階層化の信頼性が高いことを示します。損傷の序数性という順序付けの性質に監督を合わせるため、ソフトな序数分類ターゲットを導入し、明示的な序数距離ペナルティを評価します。校正済み序数監督で訓練したRT-DETRは、44.70%のmAP@0.5を達成し、4.8ポイントの改善をもたらし、序数指標（Ordinal Top-1 Accuracy 91.15%、MAOE = 0.56）での利得も得られます。これらの知見は、序数対応の監督が検出器アーキテクチャと整合する場合に損傷深刻さ推定を改善することを示しています。Model & Data: https://github.com/crumeike/TornadoNet

CopilotのExcelエージェントを使う、売上集計や分析用ブックを自動生成

日経XTECH

VoxtralResearchVoxtral TTSについて：高速で、即座に適応可能で、音声エージェント向けに臨場感のある発話を生成する最前線のオープンウェイト音声合成モデル

Mistral AI Blog

クラウドAIから専用AIボックスに切り替えた理由（そしてあなたもそうすべき理由）

Dev.to

2026年にMiMo V2 APIを無料で使う方法：完全ガイド

Dev.to

誰も解けないエージェントのメモリ問題：永続的なコンテキストのための実践的アーキテクチャ

Dev.to

TornadoNet: 序数監督を用いたリアルタイム建物損傷検出

要点

関連記事

CopilotのExcelエージェントを使う、売上集計や分析用ブックを自動生成

VoxtralResearchVoxtral TTSについて：高速で、即座に適応可能で、音声エージェント向けに臨場感のある発話を生成する最前線のオープンウェイト音声合成モデル

クラウドAIから専用AIボックスに切り替えた理由（そしてあなたもそうすべき理由）

2026年にMiMo V2 APIを無料で使う方法：完全ガイド

誰も解けないエージェントのメモリ問題：永続的なコンテキストのための実践的アーキテクチャ

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer