要約: 高解像度の幾何予測は自動運転、ロボティクス、AR/MRにおける堅牢な認識に不可欠ですが、現行の基盤モデルは実世界の高解像度シナリオへのスケーラビリティによって本質的に制限されています。これらのモデルによる2K画像での直接推論は膨大な計算量とメモリ要求を伴い、実用的なデプロイを困難にしています。この問題に対処するため、私たちは2K Retrofitを提案します。これは、バックボーンを変更・再学習せずに、あらゆる幾何学的基盤モデルに対して効率的な2K解像度推論を可能にする新規フレームワークです。私たちのアプローチは、高速な粗い予測とエントロピーに基づく疎細化を活用し、不確実性の高い領域を選択的に強化することで、最小限のオーバーヘッドで高精度・高忠実度の2K出力を実現します。広く使用されているベンチマークでの広範な実験は、2K Retrofitが一貫して最先端の精度と速度を達成し、研究の進歩と高解像度3Dビジョンアプリケーションにおけるスケーラブルなデプロイメントとのギャップを埋めることを示しています。コードは受理された場合に公開されます。
2K Retrofit: エントロピー指向の効率的なスパースリファインメントによる高解像度3Dジオメトリ予測
arXiv cs.CV / 2026/3/23
📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research
要点
- 2K Retrofitは、バックボーンを変更せず、再訓練も行わずに、ジオメトリック基盤モデルに対して効率的な2K解像度推論を行う枠組みを導入します。
- この手法は、高速な粗予測とエントロピーに基づくスパースリファインメントを組み合わせ、予測の不確実性が高い領域を選択的に改善することで、最小限のオーバーヘッドで高忠実度を実現します。
- 広範な実験により、標準ベンチマークで最先端の精度と速度を示し、自動運転、ロボティクス、AR/MRの高解像度3Dビジョンタスクへのスケーラブルなデプロイを可能にします。
- 論文が採択された場合にコードを公開する予定で、研究者や実務家にとって実用的に利用可能になることを示唆します。