SutureAgent:ピクセル空間におけるゴール条件付きオフライン強化学習で手術軌道を学習
arXiv cs.AI / 2026/3/31
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文はSutureAgentを提案し、内視鏡動画から手術用針の軌道を予測する問題を、ピクセル空間におけるゴール条件付き逐次意思決定として組み替えることで扱う。
- 針先をピクセル座標上で段階的に移動するエージェントとしてモデル化することで、隣接する運動ステップ間の連続性を捉え、時間にわたって物理的に妥当な状態遷移を強制する。
- 疎なウェイポイント注釈を用い、立方スプライン補間によってより密な教師信号へ変換することで報酬構造を構築し、その報酬が学習を導くようにする。
- 手法は、空間情報と長期の時間的理解の双方を得るために可変長クリップの観測エンコーダを用い、離散的な方向選択に連続的な大きさを組み合わせることで、将来のウェイポイントを自己回帰的に予測する。
- 安定したオフライン最適化のために、行動クローン正則化を伴うConservative Q-Learningを用いる。新しい腎臓の創傷縫合データセット(50人の患者から1,158本の軌道)で、最も強力なベースラインに比べて平均変位誤差(Average Displacement Error)を58.6%低減すると報告されている。




