CatalogStitch:カタログ画像生成のための次元に配慮した、遮蔽を保持するオブジェクト合成

arXiv cs.CV / 2026/4/13

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • CatalogStitchは、現実世界のカタログ画像生成を目的として、次元(ディメンション)に配慮し、遮蔽(オクルージョン)を保持するオブジェクト合成のための、モデルに依存しない一連の手法として提示される。
  • 製品の寸法やアスペクト比が異なる場合にマスクの適応を自動化し、挿入領域をユーザが手作業で調整する必要をなくす。
  • また、遮蔽を意識したハイブリッド復元アプローチを導入し、生成後の編集を要することなく、遮蔽される要素(前景と背景の重なり)をピクセル単位で正確に保持する。
  • 本論文では、アスペクト比の不一致と遮蔽が多いカタログ状況に焦点を当てた58例のベンチマーク「CatalogStitch-Eval」を追加し、評価用のPDF/HTMLビューアも提供する。
  • ObjectStitch、OmniPaint、InsertAnythingの3つの最先端合成モデルに対する実験により、一貫した改善が示され、生産現場における手作業のワークフロー負担の削減を目指している。

Abstract

生成的なオブジェクト合成(compositing)手法は、シーンにオブジェクトをシームレスに挿入する驚くべき能力を示してきました。しかし、これらの手法を実世界のカタログ画像生成に適用する場合、煩雑な手作業が必要になります。すなわち、商品の寸法が異なるときユーザはマスクを慎重に調整しなければならず、生成後には隠れてしまった要素を手作業で丹念に復元しなければなりません。私たちは、こうした修正を自動化するモデル非依存(model-agnostic)の手法群「CatalogStitch」を提案します。これにより、ユーザにとって使いやすいコンテンツ作成を可能にします。寸法を考慮したマスク計算アルゴリズムにより、ターゲット領域は商品の異なる寸法に適応するよう自動的に調整されます。ユーザは単に商品画像と背景を与えるだけでよく、マスクの手作業による調整は不要です。さらに、隠蔽(occlusion)を考慮したハイブリッド復元手法により、隠蔽要素のピクセル単位での完全な保持が保証され、生成後の編集ワークフローを排除します。また、58例からなるベンチマーク「CatalogStitch-Eval」を新たに導入します。これは、アスペクト比の不一致や、隠蔽が多いカタログシナリオをカバーしており、加えて補助的なPDFおよびHTMLビューアも提供します。私たちは、3つの最先端の合成モデル(ObjectStitch、OmniPaint、InsertAnything)に対して提案手法を評価し、多様なカタログシナリオにおいて一貫した改善が得られることを示します。手作業での介入を減らし、面倒な修正を自動化することで、本アプローチは生成的合成を、生産用カタログのワークフローに適した、より人にやさしい実用的なツールへと変えます。