MeshLAM:フィードフォワード・ワンショットでアニメーション可能なテクスチャ付きメッシュアバター再構成
arXiv cs.CV / 2026/4/28
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- MeshLAMは、1枚の画像からワンショットで高精細かつアニメーション可能な3Dテクスチャ付きヘッドアバターを再構成するフィードフォワード方式の枠組みです。
- 従来手法の高コストなテスト時最適化や多視点データの必要性を避けるため、共有トランスフォーマーバックボーンに基づくデュアル形状/テクスチャマップ構成を採用しています。
- メッシュの崩壊を防ぎ、変形時のトポロジーの整合性を保つために、反復的なGRUベースのデコーダと、段階的なジオメトリ変形およびテクスチャ精緻化を組み合わせています。
- さらに、投影(再投影)ベースのテクスチャ誘導機構により、外観学習を入力画像に結び付け、再構成テクスチャの一貫性を高めています。
- 実験では、再構成品質、アニメーション性能、計算効率の各観点でMeshLAMが既存の最先端手法を上回ることが示されています。




