ActivityNarrated:ウェアラブルな人間の行動理解のための、オープンエンドなナラティブ(物語)パラダイム
arXiv cs.LG / 2026/4/2
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、ウェアラブルな人間の行動認識(HAR)は、閉集合の分類から、現実世界の台本なし・個人化された振る舞いを反映するオープンエンドなナラティブ(物語)ベースの定式化へ移行すべきだと主張する。
- マルチポジションのウェアラブルセンサストリームを、自由形式で時間整合した自然言語のナラティブに対応づけるオープンボキャブラリ(開放語彙)フレームワークを提案し、事前に定義されたラベル集合を用意せずとも、活動の意味論を自然に(創発的に)得られるようにする。
- 提案手法には、(1) 自然主義的なデータ収集/注釈パイプライン、(2) センサデータと言語の意味整合性を測る検索ベースの評価、(3) センサからテキストへの推論のための言語条件付き学習アーキテクチャが含まれる。
- 実験では、固定ラベルのモデルは参加者やセンサの装着位置のばらつきに対して劣化する一方で、オープンボキャブラリのセンサ—言語整合によりより頑健な表現が得られ、下流のクローズドセット認識性能が向上する(65.3% Macro-F1 vs. 31〜34% のベースライン)。
- 本研究は、ナラティブなセンサ—言語整合を、現実世界でのウェアラブルHARの基盤として位置づけ、クローズドセット認識は整合を学習した後の下流の特別なケースとして扱えるとする。


