InstantHDR: 高ダイナミックレンジ3D再構成のための単一フォワード ガウシアン・スプラッティング
arXiv cs.CV / 2026/3/13
📰 ニュースModels & Research
要点
- InstantHDRは、未校正の複数露出のLDR入力からHDR3Dシーンを単一のフォワードパスで再構成するフィードフォワードネットワークを提案します。これにより、カメラポーズや密集点群への依存を減らします。
- 本手法は、複数露出融合のための幾何誘導的外観モデリングと、異なる照明・カメラ応答に跨るシーン固有のトーンマッピングを一般化するメタネットワークを組み合わせます。
- 一般化可能なHDRモデリングを可能にするため、HDR-Pretrainと呼ばれる事前学習データセットを構築しました。これは、多様な照明タイプと複数のカメラ応答関数を備えた168のBlenderレンダリングシーンからなるデータセットです。
- 実験結果は、最適化ベースのHDR手法と同等の合成品質を示しつつ、速度向上を大幅に実現します(単一フォワード設定で約700倍、ポスト最適化を含む設定で約20倍の速度)。
- 著者らは査読後にコード、モデル、データセットを公開する予定です。
要旨: 高ダイナミックレンジ (HDR) novel view synthesis (NVS) は、複数露出の低ダイナミックレンジ (LDR) 画像から HDR シーンを再構成することを目的とします。既存の HDR パイプラインは、知られたカメラポーズ、よく初期化された密な点群、そして時間のかかるシーンごとの最適化に大きく依存しています。現在のフィードフォワードの代替手段は、露出不変な外観を前提として HDR 問題を見落としています。これらのギャップを埋めるべく、私たちは InstantHDR を提案します。これは未校正の複数露出 LDR コレクションから 3D HDR シーンを単一のフォワードパスで再構成するフィードフォワードネットワークです。具体的には、複数露出融合のための幾何誘導的外観モデリングと、シーン固有のトーンマッピングを一般化するためのメタネットワークを設計します。HDR シーンデータが不足しているため、一般化可能なフィードフォワード HDR モデルのための事前学習データセット HDR-Pretrain を構築しました。168 個の Blender レンダリングシーン、多様な照明タイプ、および複数のカメラ応答関数を特徴とします。包括的な実験は、InstantHDR が最先端の最適化ベース HDR 手法と同等の合成性能を提供する一方で、単一フォワード設定で約 700 倍、ポスト最適化設定で約 20 倍の再構成速度の改善を実現することを示しています。すべてのコード、モデル、およびデータセットは審査プロセスの後に公開される予定です。
関連記事
[R] アイデンティティ・アンカーと権限階層の組み合わせが abliterated LLMs で 100% の拒否を実現 — システムプロンプトのみ、ファインチューニングなし
Reddit r/MachineLearning
[P] 自宅PC上の Vibecoded: Karpathyに触発されたAI支援の研究ループを用いて、約2700 Elo のブラウザでプレイ可能なニューラルチェスエンジンを構築
Reddit r/MachineLearning
DuckLLM 1.0 — 私の初めてのモデルを紹介します!
Reddit r/LocalLLaMA
FastFlowLMがLinux対応を追加したため、同社がサポートする全モデルをベンチマークしました。以下が結果です。
Reddit r/LocalLLaMA
高次元生存分析におけるネストしたモデルと非ネストモデルを比較する際に用いる評価指標は何ですか [D]
Reddit r/MachineLearning