EfficientMonoHair:単眼動画からのマルチビュー方向融合による高速なストランドレベル再構成

arXiv cs.CV / 2026/4/8

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • EfficientMonoHairは、既存手法における精度–効率のトレードオフを低減することを目的として、単眼動画からストランドレベルのヘアジオメトリを高速かつ高精度に再構成するためのフレームワークとして提示される。
  • 本手法は、暗黙的ニューラル表現とマルチビュー幾何融合を組み合わせ、点群方向推定に必要な最適化イテレーション数を削減するために、融合パッチベースのマルチビュー最適化を用いる。
  • 「hair-growing(髪の成長)」と呼ばれる並列な戦略を導入し、ボクセル占有(occupancy)制約を緩和することで、方向場がノイズ的または不正確な場合でも、大規模なストランド追跡に対する安定性と頑健性を向上させる。
  • 実世界のヘアスタイルに関する実験では高忠実度なストランド再構成が得られると報告されており、一方で合成ベンチマークでは、最先端手法と同等の品質をほぼ桁違い(約1桁弱)の実行時間改善で達成したことが示される。

概要: 細いストランド(毛束)レベルのヘア幾何形状再構成は、バーチャルヒューマンモデリングやヘアスタイルのデジタル化における基本的な課題です。しかし、既存手法はいまだに精度と効率の間に大きなトレードオフが残っています。暗黙的ニューラル表現はヘアの大域的な形状を捉えることができますが、しばしば細部までのストランドの情報を保持できません。一方、明示的な最適化ベースのアプローチは、高忠実度な再構成を実現しますが、その代わりに重い計算と、スケーラビリティの低さが問題になります。この課題に対処するために、単眼動画からストランドレベルで再構成するため、暗黙的ニューラルネットワークとマルチビュー幾何融合を組み合わせた、高速かつ高精度なフレームワーク EfficientMonoHair を提案します。本手法では、点群の方向推定に必要な最適化イテレーション数を減らす、融合パッチベースのマルチビュー最適化を導入します。さらに、ボクセル占有の制約を緩和する新しい並列ヘア成長戦略を提案し、不正確またはノイズのある方位場の下でも、大規模なストランド追跡を安定かつ頑健に維持できるようにします。代表的な実世界のヘアスタイルに対して行った広範な実験により、本手法が高い精度で高忠実度なストランド幾何を頑健に再構成できることを示します。合成ベンチマークでは、本手法は最先端手法と同等の再構成品質を達成しつつ、実行時間の効率をほぼ1桁分改善します。