XSeg:実運用のセキュリティ検査のための大規模X線違法物体セグメンテーションベンチマーク

arXiv cs.CV / 2026/4/7

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、98,644枚の画像と30種類の違法物体カテゴリにわたる295,932のインスタンスマスクを含む、新たな大規模X線違法物体セグメンテーションベンチマーク「XSeg」を提案する。これまでの研究が抱えていた、実世界におけるピクセルレベルの教師信号の不足に対処する。
  • XSegは公開データおよび合成X線ソースから構築されており、低品質サンプルを除外してデータセットの信頼性を高めるための独自データクリーニング処理パイプラインを備える。
  • 注釈コストを削減し、セグメンテーション品質を向上させるため、著者らは高価なピクセルレベルのラベリングではなく、適応的なポイントによるプロンプトを用いたSAMベースのマスク注釈モデル「Adaptive Point SAM(APSAM)」を提案する。
  • APSAMは、クロスドメインでの汎化や、積層・重なり合う物体に対する難しさといった既知のSAMの制約に対処するため、Energy-Aware EncoderとAdaptive Point Generatorを追加し、最小限のプロンプトからより感度の高い初期化と正確なマスクラベルを実現する。
  • XSegで報告された実験結果によれば、APSAMは優れた性能を達成しており、データセットと手法が実運用のセキュリティ検査モデルを改善するための実用的なリソースとして位置付けられる。