PASTA:弱教師ありターゲットおよび異常セグメンテーションのためのビジョントランスフォーマによるパッチ集約
arXiv cs.CV / 2026/4/14
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- PASTAは、鋼くずリサイクルや除草などの未見異常を扱う産業・農業向けに、弱い画像レベルの教師(weak image-level supervision)でターゲットと異常をセグメンテーションする新しいパイプラインを提案している。
- 観察シーンと通常(nominal)参照をViT(self-supervised Vision Transformer)の特徴空間で分布比較し、ターゲット/異常を同定することで、厳密な画素注釈を前提としない点が特徴だ。
- Segment Anything Model 3(SAM 3)のセマンティックなテキストプロンプトを用いたゼロショットのオブジェクトセグメンテーションによって、ガイド付きでピクセルレベルの領域推定を行う。
- 評価では独自の鋼くずリサイクルデータセットとプラントデータセットで、学習時間を75.8%削減しつつ、ターゲットは最大88.3% IoU、異常は最大63.5% IoUと高いセグメンテーション性能を示した。




