AI Navigate

テキストでエンコードされた運動学波形を用いた歩行分類のための大規模言語モデルの評価

arXiv cs.LG / 2026/3/17

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、一般目的の大規模言語モデル(LLMs)が、連続的な歩行運動学をテキスト形式の数値列としてエンコードした場合に分類できるかを評価し、Leave-One-Subject-Out交差検証を用いて、その性能を従来の分類器(KNNおよびOCSVM)と比較した。
  • 教師付きのKNNは、多クラス MCC が0.88と最高値を達成し、ゼロショットの大規模言語モデルを上回った。
  • 参照グラウンディングを用いたGPT-5は、多クラス MCCを0.70、バイナリ MCCを0.68に達し、KNNには及ばなかったが、クラス非依存OCSVMよりは上回った。
  • 高信頼度の予測を用いると、フィルタリングされたサブセットでLLMの多クラス MCCが0.83に向上し、信頼度閾値に対する感度を示した。
  • o4-miniモデルは、より大きなモデルと同等の性能を示し、計算効率の良さを強調するとともに、LLMsは直接的な診断用途よりも探索的分析に適している可能性があることを示唆している。

要旨: 背景: 機械学習(ML)は歩行分析を強化するが、臨床導入に望まれる解釈性のレベルが欠けていることがよくある。構造化された運動学データに適用した場合、巨大言語モデル(LLMs)は説明能力と信頼度を意識した出力を提供する可能性がある。本研究では、一般用途のLLMがテキスト形式の数値列として表現された連続的な歩行運動学を分類できるか、そしてその性能が従来のMLアプローチとどのように比較されるかを評価した。
方法: 下肢の運動学は、7つの歩行パターンを実施する20名の参加者から記録された。監視付きKNN分類器とクラスに依存しないOne-Class SVM(OCSVM)を、ゼロショットLLMs(GPT-5、GPT-5-mini、GPT-4.1、および o4-mini)と比較した。モデルはLeave-One-Subject-Out(LOSO)クロスバリデーションを用いて評価された。LLMsは明示的な参照歩行統計を用いた場合と用いない場合の両方でテストされた。
結果: 監視付きKNNは最高の性能を達成した(多クラス Matthews相関係数 MCC = 0.88)。参照基礎づけを持つ最も性能の良いLLM(GPT-5)は、多クラス MCC 0.70、二値 MCC 0.68 を達成し、クラス非依存のOCSVM(二値 MCC = 0.60)を上回った。LLMの性能は、明示的な参照情報と自己評価された信頼度に大きく依存していた。高信頼度の予測に限定した場合、フィルタリングされたサブセットで多クラス MCC は0.83へ増加した。計算効率の高い o4-mini モデルが、大きなモデルと同等の性能を示したことは特筆に値する。
結論: 連続的な運動学波形がテキストの数値トークンとしてエンコードされた場合、参照根拠を備えた一般用途のLLMsであっても、正確な歩行分類のための監視付き多クラス分類器には及ばず、診断用途というよりも慎重で人間が導く解釈を要する探索的システムとして見なされるべきである。