LLMPhy：大規模言語モデルと物理エンジンを組み合わせたパラメータ同定可能な物理推論

arXiv cs.RO / 2026/4/27

💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

共有:

要点

LLMPhyは、大規模言語モデルと物理エンジンを組み合わせ、質量や摩擦係数などのパラメータ同定という重要課題を明示的に扱う物理推論のための最適化フレームワークです。
本手法はデジタルツイン構築を2つに分け、連続的な物理パラメータ推定と離散的なシーン配置推定のそれぞれを、LLMが生成したプログラムを実行して物理シミュレーションの結果から反復的に改善します。
物理エンジンによる再構成誤差を学習（改良）のフィードバックとして用いることで、LLMに内在する「教科書的」な物理知識と、シミュレータ上の現実的な世界モデルを橋渡しします。
既存ベンチマークがパラメータ同定可能性を十分に評価していないことを踏まえ、ゼロショット設定向けに3つの新しいデータセットを提案しています。
実験では、LLMPhyが先行するブラックボックス手法よりも高い性能を示し、物理パラメータの復元精度と収束の信頼性がともに優れていると報告されています。

要旨: 複雑な物理的推論に対する学習ベースの多くのアプローチは、シーンのダイナミクスを支配する重要な問題であるパラメータ同定（例：質量、摩擦）を回避しがちです。しかし、衝突回避やロボット操作のような現実世界の応用では、その重要性は極めて高いです。本論文では、物理推論のために大規模言語モデル（LLM）と物理シミュレータを統合するブラックボックス最適化フレームワークであるLLMPhyを提案します。LLMPhyの中核となる着想は、LLMに埋め込まれた教科書的な物理知識を、現代の物理エンジンに実装された世界モデルと橋渡しし、潜在パラメータ推定によって入力シーンのデジタルツインを構築できるようにすることです。具体的には、LLMPhyはデジタルツイン構築を次の2つのサブ問題に分解します：（i）物理パラメータを推定する連続問題と、（ii）シーンのレイアウトを推定する離散問題です。各サブ問題に対して、LLMPhyは反復的にLLMへプロンプトを行い、パラメータ推定を符号化するコンピュータプログラムを生成させます。次に、それらを物理エンジン上で実行してシーンを再構成し、再構成誤差をフィードバックとして用いてLLMの予測を洗練（改良）します。既存の物理推論ベンチマークは、パラメータの識別可能性（identifiability）をほとんど考慮していないため、本研究ではゼロショット設定で物理推論を評価するための新しいデータセットを3つ導入します。結果として、LLMPhyは提案タスクにおいて最先端の性能を達成し、物理パラメータをより正確に復元でき、従来のブラックボックス手法よりもより確実に収束します。詳細はLLMPhyプロジェクトページをご覧ください: https://www.merl.com/research/highlights/LLMPhy