SeeClear: 生成的不透明化による信頼性の高い透明オブジェクト深度推定

arXiv cs.CV / 2026/3/23

📰 ニュースTools & Practical UsageModels & Research

共有:

要点

SeeClear は、透明領域を幾何学的に一貫した不透明な形状へと変換する拡散ベースの生成的不透明化モジュールを導入し、透明オブジェクトの安定した単眼深度推定を可能にします。
パイプラインは透明領域を局在化し、不透明化を適用した後、再訓練やアーキテクチャの変更を伴わずに既製の単眼深度推定器を使用します。
不透明化モデルを訓練するために、著者らは SeeClear-396k を作成しました。これは透明-不透明の対応を持つ 396,000 組の合成レンダリングを含むデータセットです。
合成データセットと実世界データセットでの実験により、SeeClear が透明オブジェクトの深度推定を顕著に改善することが示されました。
SeeClear のプロジェクトページは https://heyumeng.com/SeeClear-web/ に公開されています。

要約: 単眼深度推定は透明な物体に対して依然として難しく、屈折と透過を適切にモデル化することが難しく、深度推定ネットワークが用いる外観の前提を壊してしまいます。その結果、最先端の推定器は透明材料に対してしばしば不安定または誤った深度予測を出します。私たちは SeeClear という新規フレームワークを提案します。透明な物体を生成的な不透明画像へ変換し、透明物体の安定した単眼深度推定を可能にします。入力画像を与えられた場合、まず透明領域を局在化し、その屈折的な外観を幾何学的に一貫した不透明な形状へ変換する拡散モデルベースの生成的不透明化モジュールを使用します。処理された画像は再訓練やアーキテクチャの変更を行うことなく、既製の単眼深度推定器に入力されます。不透明化モデルを訓練するために SeeClear-396k を構築します。これは透明-不透明の対を含む 396k の合成データセットです。合成データと実世界データの両方のデータセットでの実験は、SeeClear が透明物体の深度推定を大幅に改善することを示しています。プロジェクトページ: https://heyumeng.com/SeeClear-web/

人型ロボットを被災建築物の調査に活用、建築研究所などが公開実験

日経XTECH

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

日経XTECH

文字起こしだけじゃない、要約から資料まで作る「AIボイスレコーダー」

日経XTECH

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

日経XTECH

Gmailで返信を自動作成、「Google AI Plus」で驚異の時短術

日経XTECH

SeeClear: 生成的不透明化による信頼性の高い透明オブジェクト深度推定

要点

関連記事

人型ロボットを被災建築物の調査に活用、建築研究所などが公開実験

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

文字起こしだけじゃない、要約から資料まで作る「AIボイスレコーダー」

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

Gmailで返信を自動作成、「Google AI Plus」で驚異の時短術

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer