要旨: 複数サイトの神経画像解析は、スキャナーによる共変量シフトによって根本的に混乱させられており、ボクセル強度の周辺分布 P(\mathbf{x}) が取得プロトコル間で非線形に変化する一方、条件付き解剖学 P(\mathbf{y}|\mathbf{x}) は一定のままである。これはとくにラジオミック再現性にとって有害で、取得のばらつきが生物学的病理変動をしばしば上回る。既存の統計的ハーモナイゼーション手法(例:ComBat)は特徴空間で動作し、空間的な下流タスクを排除してしまう。一方、標準的な深層学習アプローチは理論的には局所的有効受容野(ERF)に制約され、場の強度バイアスに特徴的なグローバルな強度相関をモデル化できない。
私たちは SA-CycleGAN-2.5D を提案します。これは Ben-David らの H\Delta H-divergence bound に動機づけられたドメイン適応フレームワークで、以下の三つの設計革新を統合します: (1) 2.5D の tri-planar マニフォールド注入を通過平面方向の勾配 を
abla_zO(HW) の計算量で保持する; (2) 密結合のボクセル間自己注意を備えた U-ResNet ジェネレータは CNN の O(\sqrt{L}) の受容野限界を超え、グローバルなスキャナー場バイアスをモデル化する; (3) スペクトル正規化された識別器は Lipschitz 定数 (K_D \le 1) を制約し、安定な敵対的最適化を実現する。 BraTS と UPenn-GBM の二つの機関ドメインで 654 名の膠腫患者を対象に評価した結果、我々の手法は Maximum Mean Discrepancy (MMD) を 99.1%低減し(1.729 \to 0.015)、ドメイン分類器の精度をほぼ偶然レベル(59.7%)まで低下させた。 アブレーション解析により、グローバルな注意機構が統計的に必須であること、すなわち harder heterogeneous-to-homogeneous translation direction では Cohen's d = 1.32, p < 0.001 であることが確認された。 2D の効率と 3D の一貫性を結ぶことで、我々のフレームワークは腫瘍の病態生理を保持したボクセルレベルのハーモナイズ画像を生み出し、多施設での再現性のあるラジオミック解析を可能にする。
SA-CycleGAN-2.5D: 三平面文脈を用いた自己注意機構付きCycleGANによる多施設MRI調和
arXiv cs.CV / 2026/3/19
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、スライス方向の勾配をO(HW)の計算量で保持する、多施設MRI調和のための2.5D三平面ドメイン適応フレームワークSA-CycleGAN-2.5Dを提案する。
- 従来のCNNの受容野を超えたグローバルなスキャナー場のバイアスを捉えるため、密なボクセル間自己注意を備えたU-ResNetジェネレーターを用いる。
- スペクトル正規化された識別器を採用し、リプシッツ制約(K_D <= 1)を課して安定した敵対的トレーニングを実現する。
- BraTSおよびUPenn-GBMにまたがる654例の膠腫患者を対象とした評価は、最大平均差(MMD)を99.1%低減し、ドメイン分類の性能をほぼチャンスレベルに近づけ、強力な調和を示した。
- この手法は2Dの効率と3Dの一貫性を橋渡し、腫瘍の病態生理を保持するボクセルレベルの調和画像を生成し、複数センターで再現可能なラジオミクス解析を可能にする。
