MedQ-UNI: 視覚-言語モデリングによる統一的な医用画像品質評価と修復を目指して

arXiv cs.CV / 2026/3/20

📰 ニュースModels & Research

共有:

要点

MedQ-UNIは、複数のモダリティとさまざまな劣化タイプを横断して、医用画像の品質評価と修復を共同で扱う統一的な視覚-言語モデルを提案します。
本手法は、共有アテンションを備えたマルチモーダル自己回帰型のデュアルエキスパートアーキテクチャを用いた、評価→復元のパラダイムを採用しており、品質評価エキスパートが復元の前に劣化を表す構造化された言語記述を出力します。
著者らは、3つのモダリティと5つの復元タスクにまたがる約5万組のペアデータと、Med-IQAおよびMed-IRの共同トレーニングのための品質アノテーションを組み合わせ、さらに約2,000サンプルの評価ベンチマークを構築しました。
実験の結果、単一のMedQ-UNIモデルが、タスク固有の適応を必要とせずすべてのタスクで最先端の復元性能を達成し、劣化記述をより優れたものとして生成することで、復元の忠実度と解釈性を向上させることを示しました。

Zenn

Dev.to

Reddit r/MachineLearning

Reddit r/MachineLearning

MarkTechPost