SynSur:合成産業用表面欠陥の生成と検出のためのエンドツーエンド生成パイプライン
arXiv cs.AI / 2026/4/30
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、産業用の欠陥検出におけるボトルネックが多くの場合モデルの能力ではなく、ラベル付き欠陥データの不足に起因する点を示し、合成データ生成を動機づけます。
- ビジョン・言語モデルによるプロンプト、LoRAで適応した拡散モデル、マスク誘導のインペインティング、さらに自動ラベル導出とサンプルのフィルタリングを組み合わせたエンドツーエンドのパイプラインを提案します。
- ボールねじ駆動部のピッティング欠陥データセットでの実験に加え、モバイル画面表面欠陥のセグメンテーション(MSD)データセットへのクロスドメイントライアルを行い、欠陥検出性能だけでなく、現実的で有用な合成サンプルを生む工程を分析します。
- YOLOv26、YOLOX、LW-DETRを用いた結果では、合成のみで学習しても実データの代替にはならない一方、合成と実データを併用すると性能を維持でき、条件によっては小幅な改善が得られることが示されます。
- 著者らは、拡散ベースの合成欠陥生成の価値は限られた実データセットを強化することにあり、転移ではドメイン適応と注釈品質管理が重要であると結論づけています。