要旨: 貨物列車における正確な視覚的故障検出は、複雑な運用環境、構造的に反復する部品、および安全上重要な領域における頻繁な遮蔽や汚染のため、知能輸送システムの保守にとって依然として重要な課題です。従来の畳み込みニューラルネットワークとトランスフォーマーに基づくインスタンス分割手法は、このような条件下で一般化能力が低く、境界精度が限定的であることが多いです。これらの課題に対処するため、貨物列車の故障検知に特化した軽量な自己プロンプト付きインスタンス分割フレームワークを提案します。我々の手法は Segment Anything Model を活用し、タスク特有のプロンプトを自動生成する自己プロンプト生成モジュールを導入することで、基盤モデルからドメイン特化の検査タスクへの効果的な知識移転を可能にします。さらに、計算コストを低減するため Tiny Vision Transformer バックボーンを採用し、鉄道監視システムのエッジデバイス上でのリアルタイム展開に適したフレームワークとします。実世界の貨物検査ステーションから収集したドメイン特化データセットを構築し、広範な評価を実施します。実験結果は、当手法がデータセット上で 74.6 AP^{\text{box}} および 74.2 AP^{\text{mask}} を達成し、精度と堅牢性の双方で既存の最先端手法を上回りつつ、計算オーバーヘッドを低く保つことを示しています。本研究は自動化された貨物列車検査のための実用的で効率的なビジョンソリューションを提供し、産業規模の故障診断シナリオにおける基盤モデル適用の潜在能力を示しています。プロジェクトページ: https://github.com/MVME-HBUT/SAM_FTI-FDet.git
貨物列車の故障検知のためのインスタンスセグメンテーションベースのプロンプト駆動型軽量基盤モデル
arXiv cs.CV / 2026/3/16
💬 オピニオンTools & Practical UsageModels & Research
要点
- 著者らは、エッジデプロイメント時の計算量を削減するために、Segment Anything Model(SAM)を自己プロンプト生成モジュールと Tiny Vision Transformer(TinyViT)バックボーンで適用した、貨物列車の故障検知用の軽量・自己プロンプト型インスタンスセグメンテーションフレームワークを提案する。
- この手法は、遮蔽や構造的に繰り返される部品を含む現実の鉄道条件を対象とし、従来のCNN/Transformerアプローチよりも一般化性能と境界の精度を向上させることを目指す。
- 実際の貨物検査駅からのドメイン固有データセットで評価し、低い計算オーバーヘッドを維持しつつ、74.6 AP_box および 74.2 AP_mask を報告し、最先端手法を上回った。
- 本研究は、産業規模の故障診断における基盤モデル適用の可能性を示し、デプロイ用コードを含むプロジェクトページを提供する。




