MedCL-Bench: 生物医学NLPにおける安定性・効率性のトレードオフとスケーリングのベンチマーク
arXiv cs.AI / 2026/3/18
📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research
要点
- MedCL-Benchは、生物医学NLPにおける継続学習を評価するための、統一されたタスク多様性を備えたベンチマークを導入し、標準化されたプロトコルの不足に対処します。
- 本手法は、五つのタスクファミリーにまたがる十の生物医学NLPデータセットを取り扱い、八つのタスク順序にわたり十一の継続学習戦略を評価し、保持、転移、およびGPU時間コストを報告します。
- バックボーンとタスク順序を横断して、直接的な逐次ファインチューニングは破局的忘却を引き起こし、継続学習アプローチの必要性を強調します。
- CL手法の中で、パラメータ分離はGPU時間あたりの保持を最も高く提供し、リプレイは高い計算コストにもかかわらず強力な保護を提供し、正則化は限定的な利益しか生みません。
- 忘却はタスク依存であり、多ラベルのトピック分類が最も脆弱で、制約付き出力タスクはより堅牢である。MedCL-Benchは展開前にモデル更新を監査するための再現性のあるフレームワークを提供します。




