トランポリン体操におけるヒト姿勢推定:新しい合成データセットによるパフォーマンス向上
arXiv cs.CV / 2026/4/3
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本研究は、トランポリン体操においてヒト姿勢推定の性能が低い問題に取り組む。選手は極端な姿勢を取り、また不自然な多視点の撮影状況となるためである。
- 研究者らは新しい合成データセット STP を提案する。モーションキャプチャで取得したトランポリン演技データから、ノイズのある mocap をパラメトリックな人体モデルに適合させ、現実的な多視点画像をレンダリングして生成する。
- STP 上で ViTPose モデルを微調整(ファインチューニング)する。2D のキーポイント精度が向上し、その効果が三角測量による 3D 姿勢復元の改善にもつながる。
- 難度の高い実際の多視点トランポリン画像に対して、微調整後のモデルは最先端(state-of-the-art)の 2D 結果を達成し、3D MPJPE を 12.5 mm 減少させる(事前学習済み ViTPose に対する 19.6% の改善)。
- 本研究は、「一般的」な姿勢シナリオと、非常に非典型的な体操の姿勢との間の性能ギャップを縮小し、ドメイン特化した知覚に対する合成データの有用性を示している。




