要旨:デジタル病理学において、全スライド画像は日常的にギガピクセル超の解像度を超え、計算量の多い生成型超解像(SR)は日常の導入には現実的でなくなる。私たちはCAFlowを導入します。これは、再構成品質を保つ最も浅いネットワーク出力へ各画像タイルを経路分岐させる、適応深度の単一ステップのフローマッチングフレームワークです。CAFlowはピクセルをシャッフルしていない再配置空間でフロー整合を実行し、直接推論を可能にしつつ、空間計算を16倍削減します。トレーニングの半分を正確な t=0 サンプルに割り当てることは、単一ステップの品質に不可欠であることを示します(これを行わない場合は-1.5 dBの低下)。バックボーンであるFlowResNet(1.90Mパラメータ)は、畳み込みと窓状自己注意ブロックを、3.1〜13.3 GFLOPsにまたがる4つの早期出口にまたがって混合します。軽量な出口分類器(約6Kパラメータ)は、わずか0.12 dBのコストで33%の計算削減を実現します。マルチオーガン病理組織のx4 SRでは、適応ルーティングはフル深度の31.84 dB PSNRに対して31.72 dBを達成し、最も浅い出口はSwinIR-lightより計算量を2.8x削減して+1.9 dBを上回ります。手法は未知の結腸組織にもほとんど品質の損失なしで一般化し、-0.02 dB、x8アップスケーリングでは、すべての同等計算量ベースラインを上回り、はるかに大きいSwinIR-Mediumモデルと競合する性能を維持します。下流の核セグメンテーションは、臨床的に関連する構造の保存を確認します。モデルは1台のGPUで5時間未満で学習し、適応ルーティングにより、全スライド推論を分単位から秒単位へ短縮できます。
CAFlow: 効率的な病理組織超解像のための適応深度・単一ステップ・フローマッチング
arXiv cs.CV / 2026/3/20
📰 ニュースTools & Practical UsageModels & Research
要点
- CAFlowは、品質を維持しつつ各画像タイルを最も浅いネットワーク出力へ経路選択することで、効率的な病理組織超解像を実現する適応深度・単一ステップのフローマッチングフレームワークを提案する。
- ピクセルを未シャッフルの再配置空間で動作することで、空間計算を16倍削減し、全スライド画像に対する直接・高速な推論を可能にする。
- モデルのバックボーンFlowResNetは1.90Mパラメータを持ち、4つの出口を有し、出口用分類器は約6Kパラメータを追加する。これにより、わずか0.12 dBの品質コストで約33%の計算量削減を達成する。
- 複数臓器病理組織のx4 SRで、適応ルーティングは31.72 dB PSNRを達成(フル深度時は31.84 dB)し、最も浅い出口はSwinIR-lightより2.8倍少ない計算量でバイキュービックを+1.9 dB上回る。さらに、未学習の結腸組織へも最小限の損失で一般化する。
- x8アップスケーリングでは、同等計算量のベースラインをすべて上回り、SwinIR-Mediumと競合する水準を維持する。下流の核セグメンテーションは臨床的に重要な構造の保持を確認しており、訓練は1台のGPUで5時間未満で完了し、全スライドに対する推論は数分から数秒の範囲で行える。

