QuietWalk：多様な履物条件における接地反力を考慮した脚部荷重に基づく物理インフォームド強化学習による二足歩行

arXiv cs.RO / 2026/4/28

📰 ニュースDeveloper Stack & InfrastructureModels & Research

共有:

要点

QuietWalkは、履物によって変化する接地反力（GRF）を明示的に考慮しながら、二足歩行ロボットの歩行を低衝撃・低騒音にするための物理インフォームド強化学習フレームワークである。
逆ダイナミクス制約付きPINN（物理インフォームドニューラルネット）で、関節などの自己受容情報から左右の各脚の鉛直GRFを推定し、その推定器を強化学習ループに組み込むことで、着地時の衝撃力を（展開時に力センサーなしで）罰する仕組みを採用している。
実ロボットの保持データセットで、逆ダイナミクス整合性を課すことで、純粋な教師あり予測に比べ鉛直GRFの予測誤差が82%〜86%低減し、適合度（決定係数）も0.39/0.67から0.99/0.99へ大きく向上した。
ハードウェア実験では、1.2m/s（裸足、4種類の床材の平均）で、平均A特性騒音が7.17dB、ピーク騒音が4.98dB低下し、歩行の静粛性が改善した。
靴種（裸足、スケートシューズ、運動靴、高いヒール）を跨いで複数の路面を評価した結果、履物由来の接触ダイナミクス変化に対して頑健に適応できることが示された。

要旨: 家庭、病院、オフィスなど、人間中心の環境で動作するヒューマノイドロボットは、足—地面の衝撃による過渡現象（transients）を緩和する必要がある。衝撃によって生じる振動と騒音はユーザー体験を損ない、衝撃の反復はハードウェアの劣化を加速させるからである。しかし、既存の低騒音な移動（ロコモーション）の訓練は、多くの場合、運動学的な代理目的（kinematic proxy objectives）や壊れやすい力センサに依存している。さらに、履物によって接触ダイナミクスが変化すると分布シフトが生じ、方策の汎化を妨げる。そこで本稿では、多様な履物条件下での地面反力（ground-reaction-force）を考慮したヒューマノイド移動のための、物理に基づく強化学習フレームワークであるQuietWalkを提案する。QuietWalkは、逆ダイナミクスに制約された物理インフォームドニューラルネットワーク（PINN）を用いて、固有受容（proprioceptive）信号から各足の鉛直方向の地面反力（GRF）を推定し、固定した予測器（frozen predictor）をRL訓練ループに組み込むことで、展開時に力センサを不要にしつつ、予測された衝撃力を罰則する。保持した実ロボットのデータセットにおいて、逆ダイナミクス整合性を強制すると、純粋な教師あり予測器と比べて鉛直GRF予測誤差が82%〜86%低減される。さらに、決定係数（coefficient of determination）は左/右の足で0.39/0.67から0.99/0.99へと改善する。速度1.2 m/sのハードウェア実験（裸足；4種類の床材で平均）では、QuietWalkは一貫した記録設定のもとで、平均のAウェイト騒音レベルを7.17 dB、ピーク騒音レベルを4.98 dB低減する。複数の床面にわたる履物横断実験（裸足、スケートシューズ、アスレチックスニーカー、高ヒール）でも、履物による接触の変動に対する頑健な適応がさらに示される。