未知の外科用器具に対する、学習不要の検出と6Dポーズ推定

arXiv cs.CV / 2026/3/27

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、事前知識としてテクスチャ付きCADモデルのみを用いて、未知の外科用器具の検出と6Dポーズ推定を行う学習不要（training-free）パイプラインを提案する。
検出では、視点ごとの物体マスク提案を生成し、事前学習済みの特徴抽出器を用いてレンダリングしたテンプレートとの類似度でスコアリングする。さらに視点間で対応付け、3D候補を三角測量で復元し、多視点の幾何学的整合性によって結果をフィルタリングする。
ポーズ推定では、視点間注意（cross-view attention）を伴う特徴量に基づくスコアリングによって、ポーズ仮説を反復的に洗練（refinement）し、その後、遮蔽を考慮した輪郭登録を最終的に多視点で実行することで、遮蔽されていない輪郭に対する再投影誤差を最小化する。
実世界のMVPSPデータセットの手術データでの評価では、制御された環境において教師あり手法と同等レベルのミリメートル精度のポーズ推定が示されるとともに、開発時には見ていない器具にも一般化できることが分かった。
本研究は、動的な臨床環境におけるマーカーレスの器具追跡とシーン理解が学習不要で実現可能であることを示し、大規模なラベル付きデータを必要とする教師あり手法の限界に対処する。

note

note

note

note

note