生成対向ネットワークを用いた黒色腫画像の生成と評価

arXiv cs.CV / 2026/3/17

📰 ニュースTools & Practical UsageModels & Research

共有:

要点

本論文は、ISIC 2018およびISIC 2020を対象にした高解像度黒色腫画像合成のため、共通前処理とR1正則化を重視したうえで、4つのGANアーキテクチャ（DCGAN、StyleGAN2、及び2つのStyleGAN3バリアント）を体系的にベンチマークする。
評価は、FID、FMD、皮膚鏡検査の定性的評価、固定済みのEfficientNet黒色腫検出器、独立した皮膚科医による評価を含む、多面的なプロトコルを用いて、統計的品質と診断関連性の双方を評価する。
StyleGAN2は、定量的性能と知覚品質の最良のバランスを達成し、gamma=0.8におけるFIDはISIC 2018で24.8、ISIC 2020で7.96、固定済み分類器がその生成画像の83%を黒色腫として認識する。
皮膚科医は合成画像と実画像を66.5%の精度で区別し（機会値50%）、評価者間の一致は低く（κ=0.17）、生成画像の現実味が高いことを示唆する。
実データセットにStyleGAN2生成黒色腫画像を追加することで、ホールドアウト実データのテストセットにおける黒色腫検出のAUCが0.925から0.945へ改善し、黒色腫MLパイプラインにおけるクラス不均衡の対処に対する実用的な利点を示す。

要旨: 悪性黒色腫は皮膚癌の中で最も致死的な形態であり、早期発見は患者の転帰を改善するうえで極めて重要です。ダーモスコピーと深層学習を組み合わせた自動皮膚病変解析は進展してきましたが、進展は大規模で十分注釈されたデータセットへのアクセスが限られていることと、黒色腫画像が著しく過少表現されているという深刻なクラス不均衡によって妨げられています。これらの課題に対処するため、本研究は高解像度の黒色腫特異的合成を目的として、4つのGANアーキテクチャ（DCGAN、StyleGAN2、およびStyleGAN3の2つのバリアント（T/R））を比較する最初の体系的ベンチマーク研究を提示します。私たちは、統一された前処理とハイパーパラメータ探索のもとで、2つの専門家注釈付きベンチマーク（ISIC 2018およびISIC 2020）上で全モデルを訓練・最適化し、R1正則化の調整に特に注意を払います。画像品質は、分布レベルの指標（FID）、サンプルレベルの代表性（FMD）、定性的なダーモスコピー検査、凍結済みのEfficientNetベース黒色腫検出器を用いた下流分類、および二人の認定皮膚科医による独立評価を組み合わせた多面的なプロトコルによって評価されます。StyleGAN2は、定量的パフォーマンスと知覚品質の最良のバランスを達成し、γ=0.8においてISIC 2018でFID 24.8、ISIC 2020でFID 7.96を達成します。固定済み分類器はStyleGAN2生成画像の83%を黒色腫と認識します。一方で皮膚科医は合成画像と実画像を識別する精度を66.5%とし（偶然確率50%）、評価者間一致は低く（κ=0.17）です。統制されたデータ拡張実験において、クラス不均衡を是正するために合成黒色腫画像を追加したところ、保持された実画像のテストセットにおける黒色腫検出のAUCが0.925から0.945へ向上しました。これらの知見は、StyleGAN2生成の黒色腫画像が診断に関連する特徴を保持していることを示し、黒色腫に焦点を当てた機械学習パイプラインにおけるクラス不均衡を緩和するうえで、測定可能な利点を提供し得ることを示しています。