拡散生成と非対称ティーチャー・スチューデントネットワークによる産業表面欠陥検出

arXiv cs.AI / 2026/4/22

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、欠陥サンプルの不足、欠陥のロングテール分布、複雑な背景下で微小な欠陥を正確に位置特定する難しさといった産業用の課題に対し、教師なし手法を提案している。
DDPM（Denoising Diffusion Probabilistic Model）を正常（欠陥なし）サンプルのみで学習し、一定分散のガウス摂動とPerlinノイズに基づくマスクによって、物理的に整合性の高い高精度な欠陥に見える合成サンプルとピクセルレベルの注釈を生成する。
非対称なティーチャー・スチューデントのデュアルストリーム構成を採用し、ティーチャーは正常特徴の安定した表現を提供し、スチューデントは正常パターンを再構成して異常領域の差分を強調する。
学習では、コサイン類似度損失とピクセル単位のセグメンテーション監督を組み合わせた共同最適化により、微小欠陥の正確な局在化を目指す。
MVTecADでの実験結果として、画像レベルAUROCが98.4%、ピクセルレベルAUROCが98.3%であり、既存の教師なしおよび主流深層学習手法を大きく上回り、実欠陥データ大量投入を不要としている。

要旨: 工業製品の表面欠陥検出は、しばしば欠陥サンプル数の不足、極端に長い裾を持つ分布（長尾分布）の問題、そして複雑な背景下で微細な欠陥を正確に局在化することの難しさに悩まされる。本論文では、これらの課題に対処するため、Denoising Diffusion Probabilistic Model（DDPM）と非対称な教師—生徒（teacher-student）アーキテクチャを統合した教師なし欠陥検出手法を提案する。まずデータレベルでは、DDPMを正常サンプルのみによって学習する。定分散のガウス擾乱と、Perlinノイズに基づくマスクを導入することで、高忠実かつ物理的に整合した欠陥サンプルとピクセルレベルのアノテーションが生成され、データ不足の問題を効果的に緩和する。次にモデルレベルでは、非対称なデュアルストリームネットワークを構築する。教師ネットワークは正常特徴の安定した表現を提供し、一方で生徒ネットワークは正常パターンを再構成し、正常領域と異常領域の間の差異を増幅する。最後に、コサイン類似度損失とピクセルごとのセグメンテーション監督を組み合わせた共同最適化戦略を採用することで、微細な欠陥の精密な局在化を実現する。MVTecADデータセットでの実験結果は、提案手法が画像レベルAUROC 98.4 supscript{%}、ピクセルレベルAUROC 98.3 supscript{%}を達成し、既存の教師なしおよび主流の深層学習手法を大きく上回ることを示している。提案アプローチは大量の実欠陥サンプルを必要とせず、工業的な欠陥検出と局在化を正確かつ頑健に可能にする。
\keywords{工業製品の欠陥検出
and 拡散モデル
and データ生成
and 教師—生徒アーキテクチャ
and ピクセルレベルの局在化}

第67回の挑戦：知識管理システムが「卓越の自己成就予言」になってしまうとき

Dev.to

開発者のためのコンテキスト・エンジニアリング：実践ガイド（2026）

Dev.to

GPT-5.5が登場、DeepSeek V4も。正直、バージョン番号にもううんざりだ

Dev.to

GPT Image 2.0でAI画像ワークフローを構築（最大の欠点も修正）

Dev.to

Max-and-Omnis/Nemotron-3-Super-64B-A12B-Math-REAPのGGUFファイルを公開

Reddit r/LocalLLaMA

拡散生成と非対称ティーチャー・スチューデントネットワークによる産業表面欠陥検出

要点

関連記事

第67回の挑戦：知識管理システムが「卓越の自己成就予言」になってしまうとき

開発者のためのコンテキスト・エンジニアリング：実践ガイド（2026）

GPT-5.5が登場、DeepSeek V4も。正直、バージョン番号にもううんざりだ

GPT Image 2.0でAI画像ワークフローを構築（最大の欠点も修正）

Max-and-Omnis/Nemotron-3-Super-64B-A12B-Math-REAPのGGUFファイルを公開

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer