見えにくく、ラベルも付けにくい:微妙な視覚現象のための生成的およびシンボリックな獲得
arXiv cs.CV / 2026/4/28
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、微細な異常(ヘアラインのひび割れや微小な空隙、低コントラストの混入物など)に対して、一般的なアクティブラーニングの獲得指標が支配的な視覚パターンを過剰に選び、データ空間のまれで重要な領域を見落としやすい失敗モードに焦点を当てています。
- GSALは、拡散ベースの難しさ推定と階層的なセマンティック被覆(カバレッジ)事前を組み合わせることで、物体検出向けにこの問題を解決するアクティブラーニング枠組みを提案します。
- 拡散成分は、再構成の不一致(reconstruction discrepancy)とデノイズのばらつき(denoising variability)を用いて提案をスコアし、曖昧で典型から外れた例を優先的に取り込みます。
- ただし拡散だけでは、難しいサンプルを支配的な意味(セマンティック)モード内で繰り返し選んでしまうため、GSALは3レベルのコンセプトグラフで未表現のセマンティック領域への獲得を促し、獲得理由も解釈可能にします。
- 実験では、薄膜欠陥のプロプライエタリデータに加え、Pascal VOCおよびMS COCOでも、不確実性・多様性・ハイブリッドの各ベースラインに比べてラベル効率とレアクラスの回収性能が一貫して向上したことが示されています。




