PhySe-RPO:拡散ベースの手術用煙除去のための、物理とセマンティクスに導かれる相対ポリシー最適化

arXiv cs.AI / 2026/3/25

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、ペアとなる教師データが限られている状況や、実際の術中における変動性に対応するための、拡散ベースの手術用煙除去フレームワークであるPhySe-RPOを提案する。
  • 決定論的な復元を用いる代わりに、本手法は復元を確率的なポリシーへと変換し、物理およびセマンティクスに導かれる相対ポリシー最適化(Relative Policy Optimization)によってそれを最適化する。
  • 物理に導かれた報酬は照明と色の一貫性を強制し、一方でCLIPベースのセマンティック報酬は、解剖学的な視覚概念を保持しつつ煙のない復元を狙う。
  • さらに、リファレンス不要の知覚制約を追加することで、合成および実環境のロボット手術データセットにまたがって、物理的整合性を維持しながら視覚品質を向上させ、臨床的な解釈可能性も確保する。
  • 実験結果は、制約付きの教師信号下で、探索/軌跡レベルの改良と、critic(批評者)を用いない更新により、拡散による復元に対して頑健で筋の通った(principled)性能を示すと報告されている。

Abstract

外科手術時のスモークは術中ビデオの品質を著しく劣化させ、解剖学的構造を見えなくし、外科的認識を制限します。既存の学習ベースの脱スモーク手法は、乏しい対応付けられた教師データと決定論的な復元パイプラインに依存しているため、実際の手術環境下で探索や強化学習駆動の洗練を行うことが困難です。我々は、Physics-およびSemantics-Guided Relative Policy Optimization によって最適化された拡散復元フレームワーク PhySe-RPO を提案します。中核となる考え方は、決定論的な復元を確率的方策へと変換し、グループ相対最適化による群相対の更新を通じて、軌跡レベルでの探索と critic(批評家)不要の更新を可能にすることです。物理ガイド付き報酬は照明と色の一貫性を課し、CLIP ベースの外科概念から学習された視覚概念のセマンティック報酬は、スモークのない状態で解剖学的に整合した復元を促進します。さらに、参照なしの知覚制約と組み合わせることで、PhySe-RPO は、合成および実環境のロボット外科データセットにわたって、物理的に整合的で、セマンティックに忠実で、臨床的に解釈可能な結果を生成します。これは、乏しい対応付けられた教師データのもとで、頑健な拡散ベース復元を実現するための原理的な道筋を提供します。