Riemannian特徴量とRNNでEMGから高次元の指の動きを復元する

arXiv cs.LG / 2026/4/27

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • 本論文は、前腕の表面筋電(EMG)から高次元の指の運動学(キネマティクス)を連続的に回帰するエンドツーエンドの枠組みを提案し、8チャネルのEMGアームバンドと1台のWebカメラ、さらに自動同期手順のみを用いて実現します。
  • 20人の参加者が拘束の少ない多様な右手動作を行う中で、EMGと15の指関節角を同期収録した10時間規模のデータセット「EMG Finger-Kinematics(EMG-FK)」を新たに公開します。
  • 中核となるモデルは、複数帯域のリーマン共分散特徴を時系列として用いる軽量GRUベースの回帰器「Temporal Riemannian Regressor(TRR)」です。
  • EMG-FKおよび公開ベンチマークemg2poseで、TRRは被験者内・被験者間の両評価において従来の最先端手法を上回り、EMG-FKでは平均絶対誤差が被験者内9.79°(±1.48)、被験者間16.71°(±3.97)に達します。
  • さらにRaspberry Pi 5上でのほぼリアルタイム運用(約10予測/秒)とロボットハンドの直感的な制御を実証し、既存手法より約1桁高速に動作することを示します。

要旨: 前腕表面筋電図(EMG)から高次元の指の運動学を連続推定できれば、手の義手、AR/XRインタフェース、および遠隔操作における自然な制御が可能になる可能性がある。 しかし、人の手のジェスチャの複雑さと前腕筋の絡み合いにより、正確な認識は本質的に難しい。 既存の手法は一般に、分類ベースの機械学習に依存することで課題の複雑性を下げており、その結果、制御可能な自由度が制限され、自然なインタラクションが損なわれる。 私たちは、市販レベルのハードウェアのみを用いた、連続的なEMGから運動学への回帰のためのエンドツーエンド・フレームワークを提案する。 このフレームワークは、8チャネルのEMGアームバンド、単一のWebカメラ、および自動同期手順を組み合わせることで、EMG指運動学データセット(EMG-FK)— 20人の参加者が豊かで制約のない右手の動作を行い、同期されたEMGと15の指関節角からなる10時間のデータセット—の収集を可能にする。 また、軽量なGRUベースのモデルであるTemporal Riemannian Regressor(TRR)を導入する。 このモデルは、多帯域のリーマン共分散特徴の系列を用いて指の運動を復号する。 EMG-FKおよび公開ベンチマークemg2poseの両方において、TRRは、被験者内および被験者間の評価のいずれでも最先端手法を上回る。 EMG-FKでは、平均絶対誤差が、被験者内で9.79 \deg \pm 1.48、被験者間で16.71 \deg \pm 3.97に達する。 最後に、Raspberry Pi 5でのリアルタイム実装と、ロボットハンドの直感的な制御を実証する。 TRRはほぼ10予測/秒で動作し、最先端手法よりもおおよそ1桁高速である。 これらの貢献により、高次元の指の運動をEMGに基づいて再現可能かつリアルタイムに復号するためのハードルが下がり、組込み型のEMGベース・システムに向けた、より自然で直感的な制御への道が開かれる。