広告

PinPoint:Stein Variational Newtonと幾何学的残差によるロボット縫合のための単眼針ポーズ推定

arXiv cs.RO / 2026/3/25

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、自律型ロボット縫合のための確率的な単眼針ポーズ推定フレームワーク「PinPoint」を提案する。深度の曖昧さと回転対称性を、ポーズ仮説の多峰性(マルチモーダル)分布として明示的に表現する。
  • PinPointは変分推論において、Stein Variational Newton手続きを用いる。解析的な幾何学的尤度と閉形式のジャコビアン、ならびにロボット把持(グラスプ)制約を組み合わせることで、多数の粒子仮説を高確率領域へ効率よく誘導しつつ、多様性を保持する。
  • 実針追跡の実データ系列での実験結果では、粒子フィルタ基準法に比べて大幅な誤差低減が示される。平均並進誤差が80%減少、平均回転誤差が78%減少するだけでなく、不確実性の較正(キャリブレーション)も大きく改善している。
  • 単眼の曖昧さを強める誘導回転系列では、PinPointは二峰性の事後分布を84%の確率で保持する。これは基準法のほぼ3倍であり、モードの早期崩壊(モード・コラプス)を回避する。
  • 体外(ex vivo)での縫合テストでは、間欠的な遮蔽や針の完全な埋め込みに至るまで、安定した針追跡が確認される。遮蔽中の平均並進誤差および回転誤差も低い。

Abstract

外科用針の3D位置と姿勢の信頼できる推定は、自律ロボット縫合に不可欠であるにもかかわらず、既存手法はほぼ例外なくステレオ視に基づいて動作しています。経自然孔的および管腔内処置で一般的な、単眼内視鏡環境では、深度の曖昧さと回転対称性により、針の姿勢推定は本質的に解が定まらない(ill-posed)問題になります。これは単一の、根拠のある推定値を返すのではなく、実現可能な構成に対して多峰性の分布を生み出します。私たちは、PinPoint を提案します。PinPoint は、この曖昧さを直接扱う確率的変分推論の枠組みであり、「曖昧さを抑え込む」のではなく「姿勢仮説の分布」を維持します。PinPoint は、単眼の画像観測とロボット把持(グラスプ)の制約を、閉形式のヤコビアンを伴う解析的幾何学的尤度によって組み合わせます。この枠組みにより、Stein Variational Newton 推論において、効率的な Gauss-Newton の前処理が可能になります。そこでは、二次の粒子輸送が高確率領域へと粒子を決定論的に移動させ、一方でカーネルに基づく反発が、多峰性の構造における多様性を保持します。実際の針追跡シーケンスにおいて、PinPoint は粒子フィルタ基準に比べて平均の並進誤差を 80%(1.00 mm まで)削減し、回転誤差を 78%(13.80{\deg} まで)削減しました。さらに、較正が大幅に改善された不確実性を提供します。単眼の曖昧さが最も深刻になる誘導回転シーケンスでは、PinPoint は 84% の時間で二峰性の事後分布を維持し、粒子フィルタ基準のほぼ 3 倍の割合を達成します。これにより、どちらか一つのモードに早々とコミットするのではなく、代替仮説を正しく保持できます。ex vivo 組織での縫合実験では、間欠的な遮蔽(オクルージョン)を含む状況でも安定して追跡でき、針が完全に埋め込まれている場合でも、遮蔽中の平均誤差は並進で 1.34 mm、回転で 19.18{\deg} でした。

広告