要旨: 生物医学イメージングにおける中心的な問題はバッチ効果です。これは、対象とする生物学的シグナルとは無関係な体系的な技術的変動を指します。これらのバッチ効果は、実験の再現性を決定的に損なうとともに、新しい実験バッチに対するディープラーニングシステムの失敗の主要原因であり、現実世界での実用化を妨げています。長年の研究にもかかわらず、ディープラーニングモデルにおいてこの性能ギャップを埋めることに成功した手法はありません。私たちは、バッチ正規化によるコントロール安定化適応リスク最小化(Control-Stabilized Adaptive Risk Minimization via Batch Normalization; CS-ARM-BN)を提案します。これは負のコントロール・サンプルを活用するメタラーニング適応手法です。摂動されていない参照画像は、設計によりあらゆる実験バッチに存在し、適応のための安定した文脈(コンテキスト)として機能します。私たちは、大規模データセットJUMP-CPにおいて、創薬にとって重要なタスクであるメカニズム・オブ・アクション(MoA)分類で、新しい手法を検証します。標準的なResNetは、訓練ドメインでは0.939 pm 0.005 だった精度が、新しい実験バッチから得られたデータでは0.862 pm 0.060 まで低下します。基盤モデルは、典型変動正規化(Typical Variation Normalization)を行っても、このギャップを埋めることに失敗します。私たちは、メタラーニング手法が0.935 pm 0.018 を達成することでドメインギャップを埋めることを初めて示します。新しい実験バッチが、別の研究室で生成されたなどの強いドメインシフトを示す場合でも、メタラーニング手法は、バイオメディカル実験で常に利用可能なコントロール・サンプルで安定化できます。本研究は、バイオイメージングデータにおけるバッチ効果が、原理に基づくインコンテキスト適応によって効果的に中和でき、さらにそれらを実用可能かつ効率的にすることも示しています。
生物医学イメージングにおけるドメインギャップの解消:インコンテキストのコントロールサンプルによる方法
arXiv cs.LG / 2026/4/23
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、生物医学イメージングにおけるバッチ効果が原因で、深層学習モデルが新しい実験バッチで性能を大きく落として再現性と実運用性を損なう問題を扱っています。
- 負のコントロールサンプルを安定したインコンテキスト参照として用いるメタラーニング適応手法CS-ARM-BNを提案し、バッチ正規化に基づくリスク最小化を行います。
- JUMP-CPデータセットでのメカニズム・オブ・アクション(MoA)分類に関する検証では、標準的なResNetが新バッチで大きく精度低下する一方で、提案手法はドメインギャップを大きく埋めることを示します。
- Typical Variation Normalization後でも基盤モデルはドメインギャップを十分に解消できないのに対し、CS-ARM-BNは強い汎化性能(訓練ドメインに近い性能)を達成すると報告されています。
- 本研究は、生物医学イメージングのバッチ効果を、実験で一般に利用可能なコントロールサンプルを用いた原理的なインコンテキスト適応によって実用的に中和できることを示唆しています。




