時間的コルモゴロフ=アルノルドネットワークによる歩行認識

arXiv cs.CV / 2026/4/14

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 提案アーキテクチャは、2段階のメモリ機構(短期のRKANサブレイヤと、ゲート付きの長期経路)を用い、CNN+TKANフレームワークによってCASIA-Bデータセットの評価設定内で高い性能を達成したと報告されている。

Abstract

群歩(gait)認識は、特徴的な歩行パターンに基づいて個人を識別するバイオメトリクスの一種です。従来のバイオメトリクス特性とは異なり、群歩は距離を置いた状態で取得でき、かつ被験者の能動的な協力なしで実現可能であるため、監視や公共安全用途に適しています。しかしながら、シルエットベースの時間的モデルは、長い系列、観測ノイズ、ならびに外見に関連する共変量に対して依然として敏感です。再帰(recurrent)アーキテクチャはしばしば初期のフレームからの情報を保持するのが難しく、最適化のために本質的に逐次的です。一方、トランスフォーマーベースのモデルは通常、より大きな計算資源とより大規模な学習セットを必要とし、さらに不規則な系列長やノイズのある入力に対して敏感である場合があります。これらの制約は、衣服の変化、荷物の携行状態、視点の変化に対する頑健性を低下させるだけでなく、局所的な群歩サイクルと、より長期の運動トレンドの同時モデリングも妨げます。これらの課題に対処するために、群歩認識のためのTemporal Kolmogorov-Arnold Network(TKAN)を提案します。提案モデルは、固定されたエッジ重みを学習可能な1次元関数に置き換え、短期のRKANサブレイヤと、ゲート付きの長期パスからなる2レベルのメモリ機構を組み込みます。この設計により、コンパクトなバックボーンを維持しつつ、サイクルレベルのダイナミクスとより広い時間的文脈の両方を効率的にモデリングできます。CASIA-Bデータセットでの実験では、報告された評価設定のもとで、提案するCNN+TKANフレームワークが強力な認識性能を達成することが示されています。