SutureAgent：ピクセル空間におけるゴール条件付きオフライン強化学習で手術軌道を学習

arXiv cs.AI / 2026/3/31

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文はSutureAgentを提案し、内視鏡動画から手術用針の軌道を予測する問題を、ピクセル空間におけるゴール条件付き逐次意思決定として組み替えることで扱う。
針先をピクセル座標上で段階的に移動するエージェントとしてモデル化することで、隣接する運動ステップ間の連続性を捉え、時間にわたって物理的に妥当な状態遷移を強制する。
疎なウェイポイント注釈を用い、立方スプライン補間によってより密な教師信号へ変換することで報酬構造を構築し、その報酬が学習を導くようにする。
手法は、空間情報と長期の時間的理解の双方を得るために可変長クリップの観測エンコーダを用い、離散的な方向選択に連続的な大きさを組み合わせることで、将来のウェイポイントを自己回帰的に予測する。
安定したオフライン最適化のために、行動クローン正則化を伴うConservative Q-Learningを用いる。新しい腎臓の創傷縫合データセット（50人の患者から1,158本の軌道）で、最も強力なベースラインに比べて平均変位誤差（Average Displacement Error）を58.6%低減すると報告されている。

Abstract

腹腔鏡動画から外科用針の軌跡を予測することは、ロボット支援縫合にとって重要であり、先読み計画、リアルタイムの誘導、より安全な動作の実行を可能にします。視覚観測から直接運動分布を学習する既存手法は、隣接する運動ステップ間の逐次的な依存関係を見落としがちです。さらに、疎なウェイポイント注釈では十分な監督信号を提供できないことが多く、教師あり学習や模倣学習の手法の難しさを一層高めています。これらの課題に対処するため、画像ベースの針軌跡予測を、逐次決定問題として定式化します。この枠組みでは、針先をピクセル空間上で一歩ずつ移動するエージェントとして扱います。この定式化により、針の運動の連続性が自然に捉えられ、時間にわたる物理的に妥当なピクセル単位の状態遷移を明示的にモデル化できます。この観点から、我々はSutureAgentを提案します。SutureAgentは、疎な注釈を3次スプライン補間によって密な報酬信号へと活用し、限定された専門家の誘導を活用しつつ、妥当な将来の運動経路を探索するよう方策を促す、目標条件付きオフライン強化学習の枠組みです。SutureAgentは観測エンコーダを用いて可変長クリップを符号化し、局所的な空間手がかりと長期の時間的ダイナミクスの両方を捉えます。そして、自律回帰的に、離散方向と連続量で構成されたアクションを通じて将来のウェイポイントを予測します。専門家デモンストレーションから安定してオフライン方策を最適化するために、行動模倣正則化を伴うConservative Q-Learningを採用します。新しい腎損傷縫合データセットに対する実験では、50人の患者から得られた1,158本の軌跡を含みます。SutureAgentは、最強のベースラインと比べてAverage Displacement Errorを58.6%低減し、針軌跡予測をピクセルレベルの逐次アクション学習としてモデル化することの有効性を示しています。