生成的潜在空間拡張によるあらゆる品質の画像のセグメンテーション
arXiv cs.CV / 2026/4/27
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- Segment Anything(SAM)モデルは、劣化の激しい低品質画像で大きく性能が低下し、現場での有効性が制限されています。
- 論文では、SAMベースのセグメンテーション枠組みの潜在空間で生成的拡散を行い、高品質な表現を再構成することで頑健性を高めるGleSAMを提案しています。
- 潜在拡散の概念をセグメンテーションに適応し、事前学習済みの拡散モデルとSAM/SAM2のパイプラインの適合性を高めるための2つの手法も追加しています。
- GleSAMは、事前学習済みのSAMおよびSAM2に対して、追加で学習すべきパラメータを最小限に抑えつつ適用できる設計になっています。
- さらに劣化の種類と強度の多様性を持つLQSegデータセットを構築し、複雑な劣化や未見の劣化でのセグメンテーション改善と、鮮明画像での汎化維持の両立を示しています。




