未知の外科用器具に対する、学習不要の検出と6Dポーズ推定
arXiv cs.CV / 2026/3/27
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、事前知識としてテクスチャ付きCADモデルのみを用いて、未知の外科用器具の検出と6Dポーズ推定を行う学習不要(training-free)パイプラインを提案する。
- 検出では、視点ごとの物体マスク提案を生成し、事前学習済みの特徴抽出器を用いてレンダリングしたテンプレートとの類似度でスコアリングする。さらに視点間で対応付け、3D候補を三角測量で復元し、多視点の幾何学的整合性によって結果をフィルタリングする。
- ポーズ推定では、視点間注意(cross-view attention)を伴う特徴量に基づくスコアリングによって、ポーズ仮説を反復的に洗練(refinement)し、その後、遮蔽を考慮した輪郭登録を最終的に多視点で実行することで、遮蔽されていない輪郭に対する再投影誤差を最小化する。
- 実世界のMVPSPデータセットの手術データでの評価では、制御された環境において教師あり手法と同等レベルのミリメートル精度のポーズ推定が示されるとともに、開発時には見ていない器具にも一般化できることが分かった。
- 本研究は、動的な臨床環境におけるマーカーレスの器具追跡とシーン理解が学習不要で実現可能であることを示し、大規模なラベル付きデータを必要とする教師あり手法の限界に対処する。



