MAEPose:mmWaveビデオにおける人の姿勢推定のための自己教師あり時空間学習
arXiv cs.AI / 2026/5/4
💬 オピニオンModels & Research
要点
- 本論文では、MAEPoseという手法を提案し、mmWaveのスペクトログラム動画に直接適用して人の姿勢推定を行うことで、事前抽出された表現に依存せずにレーダーの時空間情報を学習に活かすことを目指しています。
- MAEPoseはラベルなしのレーダー動画で学習して運動に配慮した汎化表現を獲得し、その後ヒートマップデコーダにより複数フレームの姿勢予測を出力します。
- 3つのデータセットで、leave-one-person-out交差検証と厳密な統計検定を用いた評価の結果、MAEPoseはMPJPEで最大22.1%の改善を示し(p<0.05)、既存の最先端ベースラインを一貫して上回りました。
- バイスタンダー(通行人)による干渉があるゼロショット条件でも頑健性が保たれ、誤差増加は6.5%にとどまりました。またアブレーション研究により、事前学習とヒートマップデコーダの双方が重要であることが示されています。
- モダリティ分析では、入力としてRange-Doppler動画を用いると、Range-Azimuth(またはその融合)よりも姿勢推定性能が良好で、かつ計算コストも低いことが明らかになっています。



