Recolour What Matters: トークンレベル拡散による領域認識カラー編集
arXiv cs.CV / 2026/3/20
📰 ニュースModels & Research
要点
- ColourCrafter は latent space における RGB 色トークンと画像トークンのトークンレベル融合を提案し、局所性と構造忠実度をグローバルなトーン転送手法より向上させた領域認識の色編集を可能にする。
- 色情報を意味的に関連する領域に選択的に伝搬させ、画像の元の構造を保持する。
- 知覚的 Lab 色空間に基づく損失は、輝度と色度を分離し、マスク領域内での編集を制約して、ピクセルレベルの精度を高める。
- 本研究は、連続的で多様な色変化を含む画像ペアの大規模データセット ColourfulSet を導入し、色精度、制御性、知覚忠実度の最先端性能を示している。