ラベルなし自己教師あり学習に基づく、不均衡な医療画像データセットのためのフレームワーク

arXiv cs.CV / 2026/4/3

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、ラベル付きデータの不足とクラスの長い裾(long-tailed)によるクラス不均衡という医用画像分類の課題に対して、先行する自己教師あり学習アプローチ(MIMV)を拡張し、非対称なマルチ画像・マルチビューのペア構築を用いてAMIMVを提案する。
  • AMIMVの頑健性を不均衡比率の変化に対して検証する分析を導入し、従来研究における「不均衡な医療データセットに対するSSLの性能」に関するギャップを明確に狙う。
  • 著者らは、長い裾の分布のもとで少ない教師データ条件における挙動を現実的な制約下で比較するため、11個のMedMNISTデータセットに対して8つの代表的な自己教師あり学習手法をベンチマークする。
  • 報告されている改善には、retinaMNISTで+4.25%、tissueMNISTで+1.88%、DermaMNISTで+3.1%が含まれ、AMIMVが「データ不足」と「まれなクラスの過小表現」の両方により適切に対処できることを示唆している。

要旨: 医用画像解析には、しばしば次の2つの問題が付きまといます。1) ラベル付きの大量の学習データが利用できないこと、そして2) 不均衡データへの対応、すなわち頻出クラスについては豊富なデータがある一方で、希少クラスについてはデータが非常に限られていることです。自己教師あり学習(SSL)手法は、第一の問題に対処するために一定の範囲で提案されてきましたが、医用画像分類領域において、不均衡データに対するSSLの頑健性を調べることの問題は、ほとんど取り上げられていません。本研究では、次の貢献を行います。1) 以前の研究で提案したMIMV手法を、新しい拡張戦略とともに拡張し、医用画像分類におけるデータ不足とデータセットの不均衡の両方に対処するための、非対称的なマルチ画像・マルチビュー(AMIMV)ペアを構築します。2) 医用画像においてクラス不均衡の度合いを変化させた場合に、AMIMVの頑健性を評価するためのデータ分析を行います。3) 11の医用画像データセット(MedMNIST)において、長い裾(long-tailed)分布および限定的な教師あり学習のもとで、8つの代表的なSSL手法を評価します。MedMNISTデータセットでの実験結果は、retinaMNISTで4.25%の改善、tissueMNISTで1.88%の改善、DermaMNISTで3.1%の改善を示しています。