マルチモーダル大規模言語モデルから得られる視覚事前知識に導かれた3Dスモークシーン復元
arXiv cs.CV / 2026/4/8
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、煙で劣化したマルチビュー画像からの3Dシーン復元を扱う。煙は散乱を引き起こし、視点依存の見えの変化と、ビュー間の整合性の低下につながる。
- Nano-Banana-Proによって強化した視覚入力と、煙に特化した3Dモデリング手法を組み合わせる枠組みを提案する。
- 中核となる貢献はSmoke-GSであり、明確な3Dガウスに加えて、軽量な視点依存の「medium branch(媒質ブランチ)」を用いて、方向依存の煙の影響をモデル化する、媒体(medium)を考慮した3Dガウススプラッティング手法である。
- このアプローチは、標準的な3Dガウススプラッティングのレンダリング効率を維持しつつ、頑健性を高め、煙のある状況でもより一貫し、視覚的に明瞭な新規視点を生成することを目指す。
- 抄録に記載された実験結果によれば、本手法は困難な条件下での復元および煙の復元に向けた新規視点合成を改善する。



