手首装着型IMU信号に対する生体インスパイアド自己教師付き学習
arXiv cs.LG / 2026/3/12
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、サブムーブメント理論に基づくトークン化戦略を導入し、手首の動作を無構造な時系列としてではなく、動作セグメントの連続として扱います。
- セグメント間の時間的依存関係をモデル化するため、動作セグメント再構成のマスクを用いたTransformerエンコーダの事前学習を行い、局所的な波形形状よりも高レベルの動作構造に焦点を当てます。
- NHANESデータセット(約28,000時間、約11,000人の参加者、約1,000万ウィンドウ)での事前学習により、表現は6つの被験者分離HARベンチマークで強力なウェアラブルSSLベースラインを上回り、データ不足の設定でデータ効率性の改善を示します。
- 本研究は、HARのための動作の生物学的構造の活用を強調し、コードと事前学習済み重みをコミュニティに公開します。
要旨: ウェアラブル加速度計は大規模な健康とウェルネスのモニタリングを可能にしてきたが、ラベル付きデータの不足によって堅牢な人間の動作表現を学習することが制約されてきた。自己教師付き学習は潜在的な解決策を提供するものの、既存のアプローチはセンサストリームを非構造化の時系列として扱い、人間の動作の基礎となる生物学的構造を見落としている。これは、効果的な人間活動認識(HAR)にとって重要な要因であると我々は主張する。我々は、運動制御のサブムーブメント理論に基づく新しいトークン化戦略を導入する。サブムーブメントは、連続的な手首の動作がサブムーブメントと呼ばれる基本的な基底関数の重ね合わせから成るとする。我々はトークンを「movement segment(動作セグメント)」として定義する。これは、手首の加速度計信号から容易に抽出できる、有限の数のサブムーブメントの連続からなる動作の単位である。これらのセグメントをトークンとして扱うことにより、マスク付き動作セグメント再構成を介してTransformerエンコーダを事前学習し、動作セグメントの時系列依存性をモデル化することで、局所的な波形形状よりも高レベルの動作構造へと学習の焦点を移す。NHANESコーパス(約28,000時間、約11,000人の参加者、約1,000万ウィンドウ)で事前学習した我々の表現は、6つの被験者分離HARベンチマークで強力なウェアラブルSSLベースラインを上回る。さらに、データ不足の設定ではデータ効率性が高いことを示す。コードと事前学習済みの重みは公に公開される予定です。