GeomPrompt:欠損および劣化した深度下でのRGB-Dセマンティックセグメンテーションのための幾何学的プロンプト学習
arXiv cs.RO / 2026/4/14
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- GeomPromptは、RGB-Dセマンティックセグメンテーションで深度が欠損・劣化する状況に対し、凍結したRGB-Dセグメンタの「第4チャネル」をRGBのみからタスク駆動の幾何学プロンプトとして合成する軽量なクロスモーダル適応モジュールである。
- GeomPrompt-Recoveryは、劣化した深度を補うために凍結セグメンタに有用な第4チャネル補正を予測し、深度推定ではなくセグメンテーション目的の幾何学的事前知識の回復を行う。
- SUN RGB-D上で、RGBのみ推論に比べてDFormerで+6.1 mIoU、GeminiFusionで+3.0 mIoU改善し、強力な単眼深度推定ベースラインとも競争力を示した。
- 深度劣化ではGeomPrompt-Recoveryがロバスト性を一貫して改善し、深刻な深度破損条件で最大+3.6 mIoUの向上を報告している。
- さらに単眼深度ベースラインより計算効率が高く、レイテンシーは7.8 ms(対38.3 ms/71.9 ms)で、欠損・劣化深度下での効率的なクロスモーダル補償手段になり得ると示唆している。



