骨格アクション認識のための生成的データ拡張

arXiv cs.CV / 2026/4/17

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、骨格ベースのアクション認識に必要な大規模で多様、かつ適切に注釈された3D骨格データセットの収集コストの高さを背景に、条件付き生成によるデータ拡張パイプラインを提案する。
提案手法は、アクションラベルの制約下で実際の骨格系列の分布を学習し、ラベル付きデータが少ない場合でも多様で高忠実度な合成データを生成できる。
Transformerベースのエンコーダ・デコーダ構成に、生成的リファインメント・モジュールとドロップアウト機構を組み合わせ、サンプリング時の忠実度と多様性のバランスを取る。
HumanAct12および精製済みNTU-RGBD（NTU-VIBE）での実験では、少数ショットとフルデータの両設定において複数の骨格アクション認識モデルの精度が一貫して改善されることを示した。
再現性とさらなる研究のために、著者らはソースコードを公開している。