要旨: 胸部CTスキャンからのCOVID-19検出のための深層学習モデルは、訓練データとテストデータが同一の施設に由来する場合には一般に良好に機能しますが、複数のセンターから、異なるスキャナ、画像化プロトコル、患者集団を含むデータが得られる場合にはしばしば苦戦します。主な理由の1つは、既存の手法がCOVID-19の分類を唯一の訓練目的として扱い、各スキャンのデータ出所を考慮しないことです。その結果、学習された表現は、より多くの訓練データを提供したセンターに偏りがちになります。これに対処するために、本研究ではマルチタスク学習のアプローチを提案します。このアプローチでは、モデルにCOVID-19の診断と、各スキャンの出所データセンターの両方を予測させます。2つのタスクはEfficientNet-B7のバックボーンを共有し、特徴抽出器が4つの参加センターすべてにまたがって有効な表現を学習することを促します。訓練データはソース間で均等に分配されていないため、過小評価されているセンターが見落とされないようにするため、ソース分類ヘッドに対して対数it調整付きのクロスエントロピー損失 [1] を適用します。前処理はKDS [2] を用いたSSFLフレームワークに従い、各スキャンから代表的な8枚のスライスを選択します。本手法は、308件のスキャンからなる検証セットにおいて、F1スコア0.9098、AUC-ROC 0.9647を達成します。コードは https://github.com/Purdue-M2/-multisource-covid-ct で公開されています。
CT画像における堅牢なマルチソースCOVID-19検出
arXiv cs.CV / 2026/4/7
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 既存のCT画像によるCOVID-19検出モデルは、同一施設内の学習・評価では良好でも、複数センターのCT(装置・撮像プロトコル・患者背景が異なる)では性能が落ちやすいという課題がある。
- 提案手法はマルチタスク学習により、COVID-19診断に加えて各スキャンの「データ出所センター」も同時に予測させ、共有バックボーン(EfficientNet-B7)で施設横断的な特徴表現を学習させる。
- 学習データがセンター間で偏っている点に対し、出所センター分類ヘッドにはlogit-adjusted cross-entropyを用いて、少数派センターが無視されるのを抑える。
- SSFLフレームワークにKDSを組み合わせて各スキャンから代表スライスを8枚選択し、検証データ308 scansでF1=0.9098、AUC-ROC=0.9647を達成した。
- 公開コードが提示されており(GitHubリンクあり)、再現・発展のための参照実装として利用可能である。
