Dress-ED:仮想試着と試着解除のための指示に導かれた編集
arXiv cs.CV / 2026/3/25
📰 ニュースSignals & Early TrendsModels & Research
要点
- 本論文では、仮想試着(VTON)、仮想試着解除(VTOFF)、およびテキストによる衣服編集を、1つのデータセット枠組みのもとで統合する新しい大規模ベンチマーク「Dress-ED」を提案する。
- 各Dress-EDサンプルは、店内の衣服画像、当該の衣服を着用した人物画像、編集結果、および望ましい変更内容を記述する自然言語の指示文を含む。
- Dress-EDは、MLLMベースの衣服理解、拡散(diffusion)ベースの編集、LLMによる検証を用いた完全自動のマルチモーダルパイプラインによって構築されており、3つの衣服カテゴリと7種類の編集タイプにまたがる146k+の検証済みクアドラプルを含む。
- 本研究では、言語による指示と視覚的な衣服の手がかりの両方に同時に条件付けする、統一的なマルチモーダル拡散フレームワークも提案しており、指示駆動型VTON/VTOFFの基盤(baseline)として機能することを目指している。
- 著者らは、データセットとコードが公開されると述べており、研究者が制御可能で対話的なファッション編集システムを開発・評価できるようになることを可能にする。