SBF:ビデオベースの人間の行動認識のための骨格を拡張する効果的な表現
arXiv cs.CV / 2026/4/7
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、深度、身体の輪郭、人と物体の相互作用が重要となるシーンにおいて、2D骨格をビデオベースの人間の行動認識に用いることの限界を扱う。
- 人体の各関節におけるスケール/深度の手がかり、人体の輪郭マップ、そして光学フローから導出した相互作用マップを組み合わせた、拡張表現 Scale-Body-Flow(SBF)を提案する。
- SBFを生成するために、著者らは既存の骨格および光学フロー信号からの教師信号を用いて学習されるセグメンテーションネットワーク SFSNet を導入し、追加のアノテーションを必要としない。
- 複数のデータセットでの実験により、SBF+SFSNet のパイプラインが、骨格のみの最先端手法と比べてコンパクトさや効率を同程度に保ちながら、行動認識精度を向上させることが示される。


