ビデオから時間的に手術を地図化するためのビジョン・ラングエージモデルとプラットフォーム
arXiv cs.CV / 2026/3/25
📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research
要点
- 本研究では、外科手術ビデオから時間的に手術行動を地図化するためのビジョン・ラングエージモデル「Halsted」を提案し、従来の単一手技内の限られた行動成分しか扱えない課題に取り組む。
- Halstedは「Halsted Surgical Atlas(HSA)」で学習され、自己ラベリングの反復フレームワークにより8つの外科専門領域で650,000本超のビデオを含む大規模な注釈付きライブラリを基盤としている。
- ベンチマーク向けにHSAのサブセット「HSA-27k」を公開し、従来の最先端モデルを上回る手術活動のマッピング性能と、より高い計算効率を示す。
- 外科AIの臨床導入までの「翻訳(translational)ギャップ」を埋めるために、Halsted Webプラットフォームを開発し、現場の手術者が自分の手技を数分で自動マッピングできる仕組みを提供する。
