フィードフォワード型ガウス登録による頭部アバターの作成と編集

arXiv cs.CV / 2026/3/18

📰 ニュースTools & Practical UsageModels & Research

要点

  • MATCH は、Topologically Corresponding Heads からのマルチビュー・アバターを実現するガウス登録手法で、キャリブレーション済みマルチビュー画像から頭部アバターを迅速に作成・編集します。対応関係にあるガウススプラット・テクスチャを0.5秒/フレームで予測します。
  • 本手法は、時間のかかる頭部追跡と高価な最適化を排除し、通常の作成時間を1日以上から約0.5秒/フレームへ短縮します。
  • 固定UVレイアウト上でテクスチャを推定するトランスフォーマーベースのモデルを採用し、登録ガイド付きの新規アテンションブロックを導入します。各UVマップのトークンは対応するメッシュ領域の画像トークンのみを参照するため、密なクロスビューアテンションよりも効率が向上します。
  • 本手法は、表情転送、意味的編集、アイデンティティ補間、最適化不要の追跡などの用途に対して被写体間対応を実現します。また、新規視点合成と頭部アバター生成において既存手法を上回り、最も近いベースラインより約10倍の速度で動作します。

要旨: MATCH(Topologically Corresponding Heads からのマルチビューアバター)、高品質な頭部アバターの作成と編集のためのマルチビュー Gaussian 登録法を提案します。最先端のマルチビュー頭部アバター手法は、時間のかかる頭部トラッキングと高価なアバター最適化を必要とし、多くの場合、作成全体の時間が1日以上になることがあります。MATCH は、キャリブレーション済みのマルチビュー画像から対応付けに基づいてガウススプラットテクスチャを直接予測し、フレームあたりわずか0.5秒で処理します。データ前処理を必要としません。フレーム間で学習された同一被写体内の対応付けは、個人化された頭部アバターの迅速な作成を可能にするとともに、被写体間の対応付けは、表現転送、最適化不要の追跡、セマンティック編集、アイデンティティ補間などの応用を支えます。私たちはテンプレートメッシュの固定UVレイアウト上でガウススプラットテクスチャを予測するトランスフォーマーベースのモデルを用いて、これらの対応付けをエンドツーエンドで確立します。これを実現するために、登録に導かれた新しいアテンションブロックを導入します。各UVマップトークンは、対応するメッシュ領域を描く画像トークンのみに専ら注意を向けます。この設計は、密なクロスビューアテンションと比較して、効率と性能を向上させます。 MATCH は、新規ビュー合成、ジオメトリ登録、および頭部アバター生成において既存の手法を上回り、アバター作成を最も近い競合ベースラインより10倍速くします。コードとモデルのウェイトは、プロジェクト公式ウェブサイトで公開されています。