適応型の超音波ガイド下針挿入と針追跡のためのビジョン・言語・アクションモデル

arXiv cs.RO / 2026/4/23

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、動的な画像条件下でも動作できるロボティック超音波(RUS)システムに対して、針の追跡と適応的な針挿入を統一的に扱うビジョン・言語・アクション(VLA)モデルを提案します。
  • リアルタイムのエンドツーエンド追跡を可能にするために、浅い位置情報と深い意味特徴を統合するCross-Depth Fusion(CDF)追跡ヘッドを導入しています。
  • 追跡タスク向けに大規模な事前学習済みの視覚バックボーンを効率よく適応させるため、パラメータ効率の高い特徴条件付けを行うTracking-Conditioning(TraCon)レジスタを提案しています。
  • 挿入制御では、不確実性を考慮した制御方策と非同期VLAパイプラインを組み合わせ、タイムリーで安全性の高い意思決定を実現します。
  • 実験では、先行の最先端トラッカーや手作業操作に対して一貫して優れる結果として、追跡精度の向上、挿入成功率の改善、処置時間の短縮が報告されています。