骨格ベースの人間行動認識における時間的に安定なSHAPによる高齢者ケアのための説明可能な転倒検出

arXiv cs.AI / 2026/4/16

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、高齢者ケア向けの説明可能な骨格ベース転倒検出フレームワークを提案し、標準的なフレームごとの事後的手法が生成する時間的に不安定な説明という課題に対処する。
  • 軽量なLSTMによるリアルタイム転倒分類と、時間的に意識した帰属集約手法であるT-SHAPを組み合わせる。これは、連続する時系列ウィンドウ間でSHAP値を平滑化し、信頼性を高める。
  • NTU RGB+Dデータセットでの実験結果では、分類精度94.3%、エンドツーエンド推論の遅延25 ms未満が報告されており、中価格帯のハードウェア上でのリアルタイム臨床モニタリングの実現可能性が示唆される。
  • 摂動(パータベーション)に基づく忠実性評価により、T-SHAPは標準SHAPおよびGrad-CAMよりも信頼できる説明を与えることが示され、5-fold交差検証全体で指標が一貫して改善している。
  • 安定化された帰属は、生体力学的に関連する運動の手がかり(例:下肢の不安定性や脊柱アラインメントの変化)を強調し、モデルの推論が既知の臨床的な転倒ダイナミクスと整合する。

Abstract

高齢者ケアにおける転倒検知では、正確な分類だけでなく、臨床者が信頼できる信頼性の高い説明も必要となる。しかし、既存の事後的(post-hoc)な説明可能性手法を、時系列データに対してフレームごとに適用すると、時系列的に不安定な帰属(attribution)マップが生成され、臨床者がそれを確実に意思決定に用いることができない。 この問題に対処するため、本研究では、骨格(skeleton)に基づく転倒検知のための軽量で説明可能なフレームワークを提案する。このフレームワークは、効率的なLSTMモデルと、時間に配慮した事後的集約戦略であるT-SHAPを組み合わせることで、連続する時間窓(time window)におけるSHAPベースの特徴帰属を安定化させる。標準のSHAPが各フレームを独立に扱うのに対し、T-SHAPは帰属系列に対して線形の平滑化(smoothing)演算子を適用し、高周波のばらつきを抑えつつ、局所的正確性(local accuracy)や一貫性(consistency)を含むシャプレイ値(Shapley values)の理論的保証を保持する。 NTU RGB+D Datasetに対する実験により、提案フレームワークは、推論のエンドツーエンド遅延が25ミリ秒未満でありながら94.3%の分類精度を達成し、中価格帯のハードウェアでリアルタイム要件を満たすことが示された。さらに、臨床モニタリングの導入シナリオにおける強い展開可能性が示唆される。 摂動(perturbation)ベースの忠実度(faithfulness)指標を用いた定量評価では、T-SHAPは標準SHAP(AUP: 0.89 vs. 0.91)およびGrad-CAM(0.82)と比較して、説明の信頼性を改善することが示された。5-foldの交差検証すべてにおいて一貫した改善が観測されており、説明の信頼性が向上していることが示される。 得られた帰属は一貫して、下肢の不安定性や脊柱アライメントの変化を含む、生体力学的に関連する運動パターンを強調する。これらは、転倒ダイナミクスに関する確立された臨床的観察と一致しており、長期ケア環境における透明な意思決定支援としての利用を裏付ける。