閉塞に頑健な3D人体メッシュ復元のための識別・生成の相乗(Discriminative-Generative Synergy)
arXiv cs.CV / 2026/4/24
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、部分的または深刻な隠れ(オクルージョン)下での単眼RGBからの3D人体メッシュ復元を扱い、回帰ベース手法の不正確さや、生成優先の拡散モデルによる希少ポーズでの忠実度低下といった課題に取り組みます。
- 提案手法は、見えている領域から決定論的な視覚手がかりを抽出するViTベースの識別経路と、隠れ領域に対して構造的に一貫した人体表現を生成する条件付き拡散経路を統合する「脳に着想した相乗フレームワーク」です。
- 2つの経路を効果的に橋渡しするために、識別特徴と拡散の事前(プライオリ)を整合させる「多様-一貫性特徴学習モジュール」を設計しています。
- さらに、意味レベル間で双方向の相互作用を可能にする「クロスアテンションによる多段階(マルチレベル)融合機構」により、全体の整合性と精度を高めます。
- 標準ベンチマークでの実験では主要指標での優れた性能と、複雑な実環境での頑健性が示されると報告されています。



