マルチモーダル大規模言語モデルから得られる視覚事前知識に導かれた3Dスモークシーン復元

arXiv cs.CV / 2026/4/8

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、煙で劣化したマルチビュー画像からの3Dシーン復元を扱う。煙は散乱を引き起こし、視点依存の見えの変化と、ビュー間の整合性の低下につながる。
Nano-Banana-Proによって強化した視覚入力と、煙に特化した3Dモデリング手法を組み合わせる枠組みを提案する。
中核となる貢献はSmoke-GSであり、明確な3Dガウスに加えて、軽量な視点依存の「medium branch（媒質ブランチ）」を用いて、方向依存の煙の影響をモデル化する、媒体（medium）を考慮した3Dガウススプラッティング手法である。
このアプローチは、標準的な3Dガウススプラッティングのレンダリング効率を維持しつつ、頑健性を高め、煙のある状況でもより一貫し、視覚的に明瞭な新規視点を生成することを目指す。
抄録に記載された実験結果によれば、本手法は困難な条件下での復元および煙の復元に向けた新規視点合成を改善する。

Abstract

煙によって劣化したマルチビュー画像から3Dシーンを再構成することは、煙が強い散乱効果を引き起こし、視点に依存した見えの変化を生じさせ、さらにビュー間の整合性を著しく損なうため、特に困難です。これらの問題に対処するために、視覚的事前知識を効率的な3Dシーンモデリングと統合する枠組みを提案します。Nano-Banana-Proを用いて煙で劣化した画像を強化し、再構成のためのより明確な視覚的観測を提供します。そして、煙のシーン再構成と復元を目的としたニュー・ビュー合成のための、ミディアム（媒質）を意識した3D Gaussian Splatting（3Dガウス・スプラッティング）フレームワークであるSmoke-GSを開発します。Smoke-GSは明示的な3Dガウスでシーンをモデル化し、煙によって生じる方向依存の見えの変化を捉えるための、軽量な視点依存のミディアム・ブランチを導入します。本手法は3Dガウス・スプラッティングのレンダリング効率を維持しつつ、煙による劣化に対する頑健性を向上させます。結果は、困難な煙環境において、一貫性があり視覚的に明瞭なニュー・ビューを生成するうえで、本手法の有効性が示されます。

Black Hat Asia

AI Business

いきなり完成形出すAI、建築設計に変化もたらす「たかがツール」は危険

日経XTECH

AIが数学の未解決問題を相次いで解決、証明の鍵は「形式化」

日経XTECH

[N] ミラ・ジョヴォヴィッチが開発者で、AIに投資していて、プロジェクトをオープンソースしたことを今知った

Reddit r/MachineLearning

ALTK‑Evolve: AIエージェントの業務中学習（オン・ザ・ジョブ・ラーニング）

Hugging Face Blog

マルチモーダル大規模言語モデルから得られる視覚事前知識に導かれた3Dスモークシーン復元

要点

Abstract

関連記事

Black Hat Asia

いきなり完成形出すAI、建築設計に変化もたらす「たかがツール」は危険

AIが数学の未解決問題を相次いで解決、証明の鍵は「形式化」

[N] ミラ・ジョヴォヴィッチが開発者で、AIに投資していて、プロジェクトをオープンソースしたことを今知った

ALTK‑Evolve: AIエージェントの業務中学習（オン・ザ・ジョブ・ラーニング）

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

Abstract

関連記事

Black Hat Asia

いきなり完成形出すAI、建築設計に変化もたらす 「たかがツール」は危険

AIが数学の未解決問題を相次いで解決、証明の鍵は「形式化」

[N] ミラ・ジョヴォヴィッチが開発者で、AIに投資していて、プロジェクトをオープンソースしたことを今知った

ALTK‑Evolve: AIエージェントの業務中学習（オン・ザ・ジョブ・ラーニング）

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

いきなり完成形出すAI、建築設計に変化もたらす「たかがツール」は危険