低品質X線画像のための放射線レポート生成

arXiv cs.CV / 2026/4/14

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、放射線レポート生成のための既存の視覚-言語モデルが、X線入力がノイズを含む、または低品質である場合に失敗し、その結果として実環境での性能が大幅に低下することを扱っている。
  • 低品質サンプルをMIMIC-CXRデータセットから検出するための自動品質評価エージェント(AQAA)を提案し、専用のLow-quality Radiology Report Generation(LRRG)ベンチマークを構築する。
  • 劣化に起因する性能の変動を低減するため、著者らは双レベル最適化と勾配整合性を用いたDual-loop Training Strategyを提案し、品質に依存しない診断特徴を学習する。
  • 実験の結果、このアプローチは画像品質が低下するにつれてレポート生成品質が落ち込むことを緩和できることが示されており、著者らは採択後にコードとデータを公開する予定である。

要旨: 画像と言語のモデル(VLM)は、自動化された放射線レポート生成(RRG)を大きく前進させてきました。しかし、既存の手法は暗黙的に高品質な入力を前提としており、現実の臨床環境に広く存在するノイズやアーティファクトを見落としています。その結果、現在のモデルは最適でない画像を処理するときに、著しい性能劣化を示します。このギャップを埋めるために、画像品質の変動を明示的に扱う堅牢なレポート生成フレームワークを提案します。まず、MIMIC-CXRデータセット内の低品質サンプルを同定する自動品質評価エージェント(AQAA)を導入し、低品質放射線レポート生成(LRRG)ベンチマークを構築します。劣化に起因する分布の変化に対処するために、バイレベル最適化と勾配整合性を活用した新しいデュアルループ学習戦略を提案します。この手法により、異なる品質の条件下で勾配方向を整合させることで、モデルが品質に依存しない診断特徴を学習できるようにします。大規模な実験により、提案手法が画像品質の低下によって引き起こされるモデル性能の劣化を効果的に軽減することを示します。コードとデータは採択後に公開します。