ProbeMDE:単眼深度推定のための不確実性に導かれる能動的固有感覚プローブ—外科ロボティクスにおける

arXiv cs.RO / 2026/3/25

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • ProbeMDEは、手術シーンのような不確実性が高い環境でのモノキュラー深度推定(MDE)を、RGB画像に加えて疎なプロプリオセプティブ(触覚)計測を組み合わせて改善する、費用意識型のアクティブセンシング手法として提案されます。
  • アンサンブルのMDEモデルにより密な深度地図を生成し、予測の不確実性はアンサンブル分散で定量化されます。さらに、不確実性の勾配を候補計測位置に対して評価します。
  • 触れて得る計測位置の選択でモード崩壊を防ぐために、候補位置の不確実性勾配マップ上でStein Variational Gradient Descent(SVGD)を用いて、最大限情報量の多い地点を探索します。
  • シミュレーションおよび実機実験(中心気道閉塞の外科用ファントム)で検証し、従来手法より標準の深度推定指標で精度が高く、必要なプロプリオセプティブ計測数も抑えられることを示しています。

要旨: 単眼深度推定(MDE)はロボットの知覚に有用な手段を提供しますが、その予測はしばしば不確実であり、質感のない表面、鏡面反射、そして閉塞がよく見られる手術シーンのような困難な環境では特に不正確になります。これに対処するために、本研究では、RGB画像と疎な固有受容(proprioceptive)計測を組み合わせた、コストを考慮した能動センシングの枠組みであるProbeMDEを提案します。提案手法では、MDEモデルのアンサンブルを用いて、既知の構成のもとでロボットが環境に触れて得られた固有受容により取得した既知の深度計測の疎な集合と、RGB画像の両方に条件付けて密な深度マップを予測します。予測不確実性はアンサンブルの分散により定量化し、候補となる計測位置に関する不確実性の勾配を計測します。固有受容(タッチ)において最大限の情報をもたらす位置を選択する際にモード崩壊を防ぐため、これらの勾配マップに対してStein Variational Gradient Descent(SVGD)を活用します。模擬実験と物理実験の両方で、本手法を中心気道閉塞の手術ファントム上で検証します。その結果、標準的な深度推定の指標においてベースライン手法を上回り、必要となる固有受容計測の数を最小化しつつ、より高い精度を達成することを示しました。
プロジェクトページ: https://brittonjordan.github.io/probe_mde/

ProbeMDE:単眼深度推定のための不確実性に導かれる能動的固有感覚プローブ—外科ロボティクスにおける | AI Navigate