奥を見せる:深度認識インペインティングで「ゴーストマネキン」効果を自動化する

Dev.to / 2026/4/20

💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • 専門的なEC向けの「ゴーストマネキン」(ハローマン)写真は、人物の見えない状態で服を立体的に“着ている”ように見せるため、従来は手作業での切り抜きと合成を長時間行う必要がありました。
  • Rewarx Studio AIは、内側の襟裏や袖口のカーブなどの隠れた領域を復元しつつ、スタジオ照明の整合性を保つことを中心課題として、生成AIで解決するアプローチを提示しています。
  • パイプラインはSAMによるセマンティックマスク、Depth Anythingによる深度マップ生成で陰影や3D感をガイドし、さらにアパレル構造を理解するよう微調整したSDXLインペインティングで文脈に応じた補完を行う構成です。
  • 「見えない内側」のテクスチャ理解には汎用的な語では不十分として、浮遊肢や縫い目の歪みを防ぐ制約を含む技術的ディスクリプタを潜在空間へ注入する点を強調しています。
  • その結果、画像1枚あたりの処理時間が通常の20〜30分から15秒未満へ短縮できるとされ、SKU数が多いカタログでの大規模運用にとって大きな効果が見込まれます。

**ECコマース向けアパレルの格闘
**プロのアパレル撮影では、「ゴースト・マネキン」(または中空マネキン)効果がゴールドスタンダードです。これにより、モデルを見せることなく、服が3Dに見え、なおかつ「着用されている」ように見せられます。従来は、手作業での切り抜きと、2枚の別画像を合成する作業が必要で、(モデルありと、ガーメントを裏返したもの)それぞれの写真を使って行います。この作業には何時間もかかります。

Rewarx Studio AIでは、これは生成AIが解決すべき“ちょうどよい課題”だと考えました。しかし、単に「Generate(生成)」を押すだけでは、はるかに難しいのです。

**技術的な課題:奥行き & 隠れ(オクルージョン)
**最も難しいのはモデルを消すことではなく、その背後にあったものを再構築することです。具体的には:

*襟の内側の背面。
*

*袖口のカーブ。
*

「中空」領域の内側で照明の一貫性を維持すること。

**3ステップのパイプライン ️
**これを解決するために、一般的なインペインティング(穴埋め)から離れて、専用のパイプラインを構築しました:

**セマンティック・マスキング(SAM): **Segment Anything Modelを使って、衣類を正確に分離します。ただし、マネキンを単にマスクするだけではありません。論理的にマネキンが終わるはずの「内側」の境界を予測します。

**深度推定(Depth Anything): **衣類がフラットなステッカーのように見えないように、深度マップを生成します。AIに対して「この襟の領域は、正面のフロントジッパーの奥に5cmある」といった情報を与え、シェーディングの指針になります。

**コンテキストに配慮したインペインティング: **ここが魔法の部分です。アパレルの構造を理解する、微調整済みのSDXLインペインティングモデルを使います。

プロンプトについて話しましょう(精度の部分)
AIに「見えない内部」を理解させるには、一般的な用語では不十分です。潜在空間に技術的な記述を注入して、テクスチャを誘導します:

*内部プロンプトの論理:
*
(3D中空効果:1.2), (内側の衣類テクスチャ:1.3), invisible mannequin, detailed fabric weave inside collar, consistent studio lighting, photorealistic, 8k, --no floating limbs, --no distorted seams.

**結果
**これまで通常、シニアなレタッチャーが1画像につき20〜30分かけていた工程を、15秒未満にまで削減することに成功しました。500 SKUを扱うブランドにとって、これはまさにゲームチェンジャーです。

**あなたの見解は?
**気になっています――コミュニティの誰かが、産業用途のユースケースでDepth MapsとInpaintingを組み合わせる実験をしたことはありますか?強度の高いインペインティングにおいて、素材の質感を維持する方法について、ぜひあなたの考えを聞かせてください。

Cheers,
Keble
Founder @ Rewarx Studio AI