画像編集基盤モデルを活用したデータ効率の高いCT金属アーチファクト低減
arXiv cs.CV / 2026/4/8
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文はCTスキャンにおける金属アーチファクト低減を扱い、高減衰のインプラントが画質を大きく劣化させ、標準的な深層学習では大量の対応データセットが必要になってしまう点を指摘する。
- アーチファクト低減を、汎用の視覚言語拡散基盤モデルをパラメータ効率の高いLoRAで適応させることで、文脈内推論(in-context reasoning)タスクとして再定式化する。その結果、必要データ量を16〜128組の対応例にまで削減でき(約2桁の削減)、データ効率を大幅に高める。
- 著者らは、幻覚(hallucination)を防ぐためにはドメイン適応が不可欠であることを示す。適応を行わない場合、基盤モデルがストリーク状アーチファクトを実在の物体として誤って解釈する可能性がある。
- 復元された解剖学的構造をより確実に根拠づけるために、複数参照(multi-reference)による条件付け戦略を提案する。これにより、破損した入力とともに、他被験者から得たクリーンな解剖学的実例をカテゴリ固有の推論のために提示する。
- AAPM CT-MARベンチマークでの実験により、知覚指標および放射線学的特徴に関する指標で最先端の結果を報告し、コードも公開している。



