まず形、次に意味:屋内再構成のための効率的な幾何学と意味論学習
arXiv cs.CV / 2026/5/6
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- 本論文は、屋内の3D再構成においてまず幾何(形)を学習し、その後に意味(セマンティクス)を推定する2段階手法としてFSTMを提案している。
- RGBと幾何学的手がかりを用いた「幾何ウォームアップ」を、意味の教師なしで行い、幾何が安定した後にセマンティクスのフィールド推定へ進む。
- 幾何と意味を同時に最適化する標準手法やマルチSDF設計と比べて、FSTMは特殊モジュールや複雑なマルチSDF構成を用いずに、幾何と意味の両方の再構成性能を向上させる。
- 合成データと実データの屋内ベンチマークで評価し、Replicaでは学習が2.3倍高速、ScanNet++では現実の欠陥に対する頑健性が高く、より多くの物体表面を復元して再現率(recall)も向上することを示した。
- 著者らは、コードを公開する予定であると告知しており、利用や追加検証の促進が期待できる。




