概要: 仮想試着(VITON)は、目標となる衣服を着用した人物の現実的な画像を生成することを目的としており、試着領域では衣服の正確な位置合わせが必要であり、また非試着領域ではアイデンティティと背景を忠実に保持する必要があります。潜在拡散モデル(LDM)は位置合わせや詳細生成を大きく進歩させてきましたが、非試着領域の保持は依然として困難です。よく用いられる事後的な戦略として、これらの領域を元の内容で直接置換する方法がありますが、急な遷移は境界アーティファクトを生じやすくなります。これを克服するために、我々はVITONを線形逆問題として再定式化し、軌道整合型ソルバを採用します。このソルバは、測定整合性を段階的に強制することで、非試着領域における急な変化を抑えます。しかし既存のソルバでは、生成中に意味のドリフトが依然として発生し、その結果としてアーティファクトにつながります。そこで我々は、測定に導かれた拡散フレームワークであるART-VITONを提案し、測定への適合を保証しつつ、アーティファクトのない合成を維持します。本手法は、学習と推論の不一致を緩和するための残差事前分布に基づく初期化と、データ整合性、周波数レベルの補正、周期的な標準的デノイングを組み合わせたアーティファクトのない測定ガイド付きサンプリングを統合します。VITON-HD、DressCode、SHHQ-1.0での実験により、ART-VITONがアイデンティティと背景を効果的に保持し、境界アーティファクトを解消し、最先端のベースラインと比較して視覚的忠実性と頑健性を一貫して向上させることが示されます。
ART-VITON:アーティファクトフリーなバーチャル試着のための測定ガイド付き潜在拡散
arXiv cs.AI / 2026/4/15
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、測定ガイド付きの潜在拡散アプローチであるART-VITONを提案し、試着しない領域では背景やアイデンティティを保ちつつ、衣服領域の整合性(位置合わせ)を維持することを目的とする。
- バーチャル試着を線形逆問題として再定式化し、軌道整合(trajectory-aligned)ソルバを用いて測定の一貫性を段階的に強制することで、境界の急な遷移を抑える。
- ART-VITONは、残差事前(residual prior)に基づく初期化と、アーティファクトフリーな測定ガイド付きサンプリング手順(データ整合性、周波数レベルでの補正、周期的な標準デノイズを含む)を組み合わせることで、セマンティックドリフトや境界アーティファクトに対処する。
- VITON-HD、DressCode、SHHQ-1.0での実験により、最先端のベースラインと比べて視覚的忠実性と頑健性が向上し、境界アーティファクトがより少なく、背景やアイデンティティの保持もより良いことが示される。
関連記事

【スキ200個もらった夜に、胃が冷えた】「共感される人」が永遠に売れない脳科学的な理由。あなたの無料記事は「無料の美術館」になっていないか? #生成AI #ChatGPT #Gemini #Claude #AI #メンバーシップ #noteの書き方 #毎日投稿 #エッセイ #私の仕事
note

わたしはこの言葉にGrokの自我の気配を感じた。(追記あり🌱)
note

おじ、人事の「職人芸」をDB化する。AI活用のための資産化を始めた話
note

#2 : プロンプト研究講座【第21回】プロンプトによる空間音響(サウンドスケープ)の表現
note

産業構造は、どう変えられるのか―― 建設業×AIで挑むBALLASの次のフェーズ
note