骨格に制約を与えた空間グラフとモーション適応型マルチスケール時間モデリングによる効率的な3D人体姿勢推定
arXiv cs.CV / 2026/4/7
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、単眼動画に対する効率的な3D人体姿勢推定フレームワークであるMASC-Poseを提案し、空間的・時間的な依存関係モデリングの両方の課題に取り組む。
- 適応的マルチスケール時間モデリング(AMTM)モジュールを用いて、時間スケールごとに異なる運動ダイナミクスをモーションに適応する形で捉える。
- 空間推論のために、骨格構造の制約を活用しつつ関節ごとの相互作用をモデル化する、Skeleton-constrained Adaptive GCN(SAGCN)を提案する。
- Human3.6MおよびMPI-INF-3DHPでの実験により、本手法は固定的または密な注意(dense-attention)に重きを置く方式と比べて計算効率の高さを維持しながら精度を向上できることが示される。


