単一RGB画像から3DMMフェイスモデルを用いた3Dヒト顔再構成

arXiv cs.CV / 2026/5/6

📰 ニュースModels & Research

共有:

要点

この論文は、単一のRGB画像から3Dヒト顔モデルを復元するパイプラインを提案し、奥行きなどの追加入力なしで形状推定を可能にします。
顔検出とランドマーク検出に続いて、3DMM（3Dモルフォーブルモデル）のパラメータを回帰し、最後にソフトレンダリングを行う構成で、最終的な3D顔を生成します。
著者らは、学習データ生成に用いられる粗いモルフォーブル顔モデルの限界として、シワのような詳細まで含むフォトリアルなデータを作りにくい点を指摘しています。
arXivのプレプリントとして公開されており、コードリポジトリとPyTorchの関連実装へのリンクも示されています。

概要: 今日、畳み込みニューラルネットワークが画像処理分野における強力な問題解決能力を示していることから、2Dの顔画像または動画から詳細な顔の形状を復元する取り組みが行われてきました。しかし、CNNを最大限に活用するには、多数のラベル付きデータがネットワークの学習に必要です。粗いモーフィング可能な顔モデル（coarse morphable face model）は、ラベル付きデータを合成するために用いられてきました。しかし、粗いモーフィング可能な顔モデルは、しわのような細部を備えた写真のようにリアルなデータを生成するのが難しいという課題があります。本プロジェクトでは、単一のRGB画像から人間の顔の3Dモデルを復元するパイプラインを提示します。このパイプラインには、顔検出、ランドマーク検出、3DMMモデルパラメータの回帰、そしてソフトレンダリングが含まれます。指導教員: Zhipeng Fan（メール: zf606@nyu.edu）コードリポジトリ: https://github.com/SeVEnMY/3d-face- reconstruction コード参照: https://github.com/sicxu/Deep3DFaceRecon pytorch

DXは継続、AI活用の新需要を ITサービス（SIer）の業界地図

日経XTECH

Google、Gemma 4向け「Multi-Token Prediction（MTP）Drafters」をリリース——品質を落とさず最大3倍高速推論

MarkTechPost

Solidity LMがOpusを上回る

Reddit r/LocalLLaMA

量子・重力・古典相互作用を一つの作用で扱う方程式と、その実装メモ

Qiita

Qwen 3.6 27B の量子化（BF16、Q8_0、Q6_K、Q5_K_XL、Q4_K_XL、IQ4_XS、IQ3_XXS…）における品質比較

Reddit r/LocalLLaMA

単一RGB画像から3DMMフェイスモデルを用いた3Dヒト顔再構成

要点

関連記事

DXは継続、AI活用の新需要を ITサービス（SIer）の業界地図

Google、Gemma 4向け「Multi-Token Prediction（MTP）Drafters」をリリース——品質を落とさず最大3倍高速推論

Solidity LMがOpusを上回る

量子・重力・古典相互作用を一つの作用で扱う方程式と、その実装メモ

Qwen 3.6 27B の量子化（BF16、Q8_0、Q6_K、Q5_K_XL、Q4_K_XL、IQ4_XS、IQ3_XXS…）における品質比較

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer