要約: 教師なしの物理パラメータ推定は動画からの共通のベンチマークを欠いています。既存の手法は重複しない合成データで評価され、唯一の実世界データセットは単一体システムに限定され、支配方程式の識別を扱う確立されたプロトコルはありません。この研究はIRISを紹介します。高忠実度のベンチマークで、4K解像度かつ60fpsで撮影された実世界ビデオ220本で構成され、単一体および多体ダイナミクスの範囲を、独立して測定された真のパラメータ値と不確実性推定とともにカバーします。各ダイナミカルシステムは制御された実験室条件下で記録され、支配方程式と対になっています。これにより原理的な評価が可能になります。パラメータの精度、識別性、外挿、頑健性、および支配方程式の選択を包含する標準化された評価プロトコルを定義します。複数のベースライン手法を評価しており、マルチステップの物理損失の定式化や4つの補完的な方程式識別戦略(VLM時系列推論、説明してから分類する prompting、CNNベースの分類、パスベースのラベリング)を含み、IRISの全シナリオにおける参照性能を確立し、将来の研究を促す体系的な失敗モードを明らかにします。データセット、注釈、評価ツールキット、およびすべてのベースライン実装は公開されています。
IRIS: 単眼動画からの物理的動的システムの逆推定と同定の実世界ベンチマーク
arXiv cs.CV / 2026/3/18
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- IRISは、単眼動画からの物理的動的システムの逆推定と同定の高忠実度の実世界ベンチマークを導入する。220の実世界の4K/60fpsシーケンスから構成され、それぞれ独立に測定された真のパラメータと不確実性推定を含む。
- 標準化された評価プロトコルを定義し、パラメータの精度、識別性、外挿性、頑健性、および支配方程式の選択を評価する。
- 本研究は複数のベースラインを評価しており、マルチステップ物理損失と4つの方程式識別戦略—VLMの時系列推論、記述-分類プロンプト、CNNベースの分類、パスベースのラベリング—をIRISのシナリオ全体で適用している。
- データセット、アノテーション、評価ツールキット、およびすべてのベースライン実装は、再現性のあるベンチマークを可能にするために公開されている。




