Splat2Real: 3D Gaussian Splattingによる物理AIの新規視点スケーリング

arXiv cs.CV / 2026/3/12

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • Splat2RealはReal2Render2Real単眼深度プリトレーニングを模倣学習として位置づけ、シーンメッシュからレンダリングされた専門家のメトリック深度/可視性を模倣する学生の深度ネットワークと、3D Gaussian Splattingがスケーラブルな新規視点観測を提供します。
  • CN-Coverageを導入。幾何利得と外挿ペナルティによって視点を貪欲に選択するカバレッジ+新規性のカリキュラムであり、低信頼性の教師に対する品質重視のガードレール代替を備えます。
  • ステップマッチ予算(N=0から2000の追加レンダリング視点、Nのユニーク数は最大500、予算が大きい場合は再サンプリング)を用いた20のTUM RGB-Dシーケンスでは、素朴なスケーリングは不安定です。CN-CoverageはRobot/Coverageポリシーに対する最悪ケースの後戻りを緩和し、GOL-Gated CN-Coverageは中〜高予算で最も強い安定性を提供し、最高の高新規性尾部誤差を低く抑えます。
  • 下流のコントロールプロキシの結果とNの比較は、視点シフト下で安全性/進捗のトレードオフを移動させることにより、具体的な関連性の証拠を提供します。
物理AIは訓練と展開の間で視点移動に直面し、新規視点の頑健性は単眼RGBから3Dへの認識にとって不可欠である。 Real2Render2Real単眼深度プリトレーニングをデジタルツインのオラクルからの模倣学習風の監視として位置づける。すなわち、学生深度ネットワークはシーンメッシュからレンダリングされた専門家のメトリック深度/可視性を模倣し、3D Gaussian Splattingがスケーラブルな新規視点観測を提供する。我々はSplat2Realを提案する。新規視点スケーリングに焦点を置き、性能は追加される視点の種類の方に依存し、単なる視点数には依存しない。CN-Coverageを導入する。幾何利得と外挿ペナルティに基づいて視点を貪欲に選択するカバレッジ+新規性カリキュラムであり、低信頼性の教師に対する品質を意識したガードレール代替も併置する。20のTUM RGB-Dシーケンスを対象とし、ステップマッチ予算(N=0から2000の追加レンダリング視点、Nユニーク<=500、大予算時には再サンプリング)で素朴なスケーリングは不安定である。CN-CoverageはRobot/Coverageポリシーと比較して最悪ケースの後戻りを緩和し、GOL-Gated CN-Coverageは中〜高予算で最も高い安定性を提供し、最高の高新規性尾部誤差を低く抑える。下流のコントロールプロキシの結果をNと比較することで、視点移動下で安全性/進捗のトレードオフを変化させ、具現化された関連性の証拠を提供する。