MedQ-UNI: 視覚-言語モデリングによる統一的な医用画像品質評価と修復を目指して
arXiv cs.CV / 2026/3/20
📰 ニュースModels & Research
要点
- MedQ-UNIは、複数のモダリティとさまざまな劣化タイプを横断して、医用画像の品質評価と修復を共同で扱う統一的な視覚-言語モデルを提案します。
- 本手法は、共有アテンションを備えたマルチモーダル自己回帰型のデュアルエキスパートアーキテクチャを用いた、評価→復元のパラダイムを採用しており、品質評価エキスパートが復元の前に劣化を表す構造化された言語記述を出力します。
- 著者らは、3つのモダリティと5つの復元タスクにまたがる約5万組のペアデータと、Med-IQAおよびMed-IRの共同トレーニングのための品質アノテーションを組み合わせ、さらに約2,000サンプルの評価ベンチマークを構築しました。
- 実験の結果、単一のMedQ-UNIモデルが、タスク固有の適応を必要とせずすべてのタスクで最先端の復元性能を達成し、劣化記述をより優れたものとして生成することで、復元の忠実度と解釈性を向上させることを示しました。
関連記事
【GPTモデル】改めて振り返るLLMの歴史
Zenn

モデル・コンテキスト・プロトコル(MCP)完全ガイド:2026年にAIネイティブ・アプリケーションを構築する
Dev.to
[R] 敵対的機械学習(Adversarial Machine Learning)
Reddit r/MachineLearning
[R] より効率的なAIへの道としての三値(ternary)ニューラルネットワーク――(+1, 0, -1)重み量子化は本格的に研究の注目を集めているのか?
Reddit r/MachineLearning

NVIDIA AIがPivotRLを導入:4分の1のロールアウトターンで高いエージェント精度を実現する新しいAIフレームワーク
MarkTechPost