RADS：強化学習ベースのサンプル選択により、低リソースかつクラス不均衡な臨床環境での転移学習が改善

arXiv cs.CL / 2026/4/23

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、転移学習におけるfew-shotファインチューニングの成否は、どの学習サンプルを選ぶかに大きく左右され、極端な低リソースかつクラス不均衡の臨床環境では単純な能動学習の手法が失敗しやすいと指摘しています。
さらに、uncertainty samplingやdiversity samplingのような一般的手法は、真に有益な例ではなく外れ値を優先してしまい、結果として性能が低下しうることを示しています。
著者らは、最も有益なサンプルを選ぶための強化学習に基づくサンプル選択戦略として、RADS（Reinforcement Adaptive Domain Sampling）を提案しています。
複数の実世界の臨床データセットでの実験により、RADSが従来手法よりも重度のクラス不均衡下でも頑健な性能を保ちながら転移性を向上させることが示されています。

要旨: 転移学習における一般的な戦略は少数ショットのファインチューニングですが、その成功は学習例として選択されるサンプルの質に大きく依存します。不確実性サンプリングや多様性サンプリングといった能動学習手法は、有用なサンプルを選択できます。しかし、極端に低リソースかつクラス不均衡の条件下では、これらの手法は真に有益なサンプルよりも外れ値を優先してしまうことが多く、その結果として性能が低下します。本論文では、最も有益なサンプルを特定するために強化学習（RL）を用いた頑健なサンプル選択戦略であるRADS（Reinforcement Adaptive Domain Sampling）を提案します。複数の実世界の臨床データセットに対する実験評価により、当社のサンプル選択戦略は、従来手法と比較して、極端なクラス不均衡下でも頑健な性能を維持しながら、モデルの転移可能性を向上させることを示します。