概要: 送電回廊のポイントクラウドに対するきめ細かな意味的セグメンテーションは、知能的な電力線インスペクションにとって基本となるものです。しかし、現在の進展は、現実的なデータ不足、および長くて多様性のあるシーンにおいて、回廊のグローバルな構造と局所的な幾何学的詳細をモデル化することの難しさによって制限されています。既存の公開データセットは通常、粗いカテゴリをわずかに提供するか、長距離の構造的な依存関係を見落とす短い切り出しシーンしか提供しないことが多く、さらに重度のロングテール分布や、安全に直結する構成要素間の微妙な差異も考慮されていません。その結果、現在の手法は現実的な検査環境のもとで評価することが難しくなっており、補完的なグローバル情報とローカル情報を保持し統合する能力がどの程度かは不明確です。
上記の課題に対処するため、送電回廊セグメンテーションのための異種ベンチマークであるTowerDatasetを導入します。TowerDatasetには、661の実世界シーンと約2.4660億ポイントが含まれています。長い回廊の範囲を保持し、きめ細かな22クラスの階層分類を定義し、標準化された分割と評価プロトコルを提供します。
さらに、シーン全体と局所的な詳細情報を保持し融合するグローバル・ローカル融合フレームワークを提案します。NoCrop学習とプロトタイプ的コントラスティブ学習を用いたシーン全体ブランチは、長距離のトポロジーと文脈依存を捉えます。ブロックごとの局所ブランチは、細かな幾何学的構造を保持します。両方の予測は、その後で幾何学的検証によって融合・洗練されます。この設計により、モデルは稀で混同しやすい構成要素を認識する際に、グローバルな関係とローカルな形状の詳細の両方を活用できます。TowerDatasetおよび2つの公開ベンチマークでの実験により、提案ベンチマークの難しさと、現実の複雑で異種な送電回廊シーンにおける我々のフレームワークの頑健性が示されています。データセットはまもなく https://huggingface.co/datasets/tccx18/Towerdataset/tree/main で公開されます。
TowerDataset:送電回廊セグメンテーションのための異種ベンチマークとグローバル・ローカル融合フレームワーク
arXiv cs.CV / 2026/4/21
📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research
要点
- この論文では、送電回廊のポイントクラウドに対するセマンティック・セグメンテーションのための新しい異種ベンチマーク「TowerDataset」を提案し、送電線の知能的な点検を目的としています。
- TowerDatasetは661の実世界シーンと約24.66億ポイントを含み、長い回廊の範囲を保持しつつ、きめ細かい22クラスの分類体系と標準化された分割・評価プロトコルを提供します。
- 著者らは、長距離のトポロジーや文脈依存関係を捉えるために、全体シーンを扱うブランチ(NoCrop学習+プロトタイプコントラスト学習)を用いたグローバル・ローカル融合フレームワークを提案します。
- ブロック単位のローカルブランチが細かな幾何学的特徴を保持し、両者の予測を幾何学的バリデーションで融合・洗練することで、希少かつ安全上重要な部品の認識を改善します。
- TowerDatasetおよび2つの公開ベンチマークでの実験により、このベンチマークの現実性と、提案手法の複雑で異種なシーンにおける頑健性が示されており、データセットはHugging Faceで間もなく公開予定です。
