多モーダルMRIにまたがる脳腫瘍分類のためのオリエンテーション認識型教師なしドメイン適応

arXiv cs.CV / 2026/5/6

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、専門家による注釈付きMRIデータの不足と、施設間でのスキャナや撮像プロトコル、造影条件の違いによるドメインシフトが原因で、脳腫瘍分類モデルが現場で十分に汎化できない問題に取り組む。
  • 混在する2D MRIスライスをまず軸位・矢状位・冠状位に分類し、その後オリエンテーションごとにResNet50バックボーン+4層の全結合層を用いた特徴抽出器で腫瘍分類を行う、オリエンテーション認識型の教師なしドメイン適応フレームワークを提案する。
  • T1/T2/FLAIRなどのマルチモーダルなソース領域から、注釈なしのポストコントラストT1ターゲット領域へ知識を移すため、スライス単位の教師なし適応を行い、特徴レベルの整合を最大平均ディスクレパンシ(MMD)損失で強制する。
  • クラス識別性を保つために、MMDに加えて疑似ラベルに導かれる適応を導入して、ドメイン不変な表現学習を支援する。
  • 実験ではターゲット領域で既存手法より高い性能が示され、オリエンテーション別学習・マルチモーダル転移・教師なし整合・疑似ラベル誘導を組み合わせることで頑健性が向上することを示唆している。

Abstract

神経腫瘍学における脳腫瘍診断のための深層学習モデルの臨床統合は、専門家によって注釈されたMRIデータが限られていること、ならびにスキャナ、撮像プロトコル、造影条件の違いに起因する施設間のドメインシフトが大きいことによって、厳しく制約されています。これらの課題は、現実の運用環境におけるモデルの汎化性能を著しく損ないます。そこで本研究では、混合した2D MRIスライスを用いた自動脳腫瘍分類のための、新規の方位(orientation)に着目した教師なしドメイン適応フレームワークを提案します。まず、広い受容野を持つCNNが入力スライスを軸位(axial)、矢状位(sagittal)、冠状位(coronal)の各ビューに分類します。各方位ごとに、ResNet50バックボーンに4つの全結合層を追加したCNNアーキテクチャを訓練し、腫瘍分類のための識別的特徴を抽出します。注釈の乏しさとドメイン間の不一致を緩和するために、スライス単位の教師なしドメイン適応戦略を導入します。この戦略では、T1、T2、FLAIRのような多モーダルのソースドメインから、造影後T1のターゲットドメインへと知識を転送します。特徴レベルの整合は最大平均差異(maximum mean discrepancy)損失によって強制し、クラスの識別性を維持するために疑似ラベルに導かれた適応を補完します。広範な実験により、従来手法よりもターゲットドメインでの性能が向上することが示されます。これは、方位に特化した学習、多モーダル知識の転送、疑似ラベルに導かれた適応、および教師なしドメイン適応の有益性を裏付けています。