PhySe-RPO:拡散ベースの手術用煙除去のための、物理とセマンティクスに導かれる相対ポリシー最適化
arXiv cs.AI / 2026/3/25
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、ペアとなる教師データが限られている状況や、実際の術中における変動性に対応するための、拡散ベースの手術用煙除去フレームワークであるPhySe-RPOを提案する。
- 決定論的な復元を用いる代わりに、本手法は復元を確率的なポリシーへと変換し、物理およびセマンティクスに導かれる相対ポリシー最適化(Relative Policy Optimization)によってそれを最適化する。
- 物理に導かれた報酬は照明と色の一貫性を強制し、一方でCLIPベースのセマンティック報酬は、解剖学的な視覚概念を保持しつつ煙のない復元を狙う。
- さらに、リファレンス不要の知覚制約を追加することで、合成および実環境のロボット手術データセットにまたがって、物理的整合性を維持しながら視覚品質を向上させ、臨床的な解釈可能性も確保する。
- 実験結果は、制約付きの教師信号下で、探索/軌跡レベルの改良と、critic(批評者)を用いない更新により、拡散による復元に対して頑健で筋の通った(principled)性能を示すと報告されている。
