要旨: 人間の動作に対する既存の表現は、MotionGPT のように、解釈性が限られたブラックボックス潜在ベクトルとして機能することが多く、関節位置に基づいて構築されるため、曖昧さを生み出す可能性があります。自然言語の階層構造 - 文字から語、句、文へ - に触発され、私たちは LingoMotion を提案します。これは、単純な動作と複雑な動作の両方に対して、解釈可能で曖昧さのない象徴的表現を促進するモーション言語です。
本論文では、LingoMotion の概念設計を紹介します。これには、関節角度に基づく動作アルファベットの定義、歩行のような単純な動作を説明するための語と句を形成する形態、速度やスケールといった属性、および語と句の列を用いてより複雑な人間の活動を記述する構文の設計が含まれます。
大規模なモーションデータセット Motion-X を用いたモーションアルファベットの実装と評価を含む予備的な結果は、モーション表現の高い忠実度を示しています。
LingoMotion: 人間の動作に対する解釈可能で曖昧さのないシンボリック表現
arXiv cs.CV / 2026/3/17
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- LingoMotion は、人間の動作の不透明な潜在表現を置き換えることを目指す、象徴的で解釈可能な動作言語を導入します。
- 関節角度に基づく動作アルファベットを定義し、歩行のような単純な動作から複雑な活動までを記述する語彙、フレーズ、構文を構築します。
- このアプローチは大規模な Motion-X データセットで評価され、動作表現の高い忠実度と解釈性を示します。
- より透明で組成的な動作記述を可能にすることで、アニメーション、ロボティクス、そして人間–機械の相互作用といった分野での応用を見据えています。




