SciLT:科学画像領域における長尾分類
arXiv cs.CV / 2026/4/7
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文では、科学画像領域における長尾分類を研究し、科学データが自然画像の事前学習分布と強く異なる場合、基盤モデルの従来の微調整では得られる改善が限られることを見いだす。
- 3つの科学ベンチマークに関する実験により、中間(直前)の層(penultimate layer)から得られる特徴が、尾部クラスの性能にとりわけ重要であることが示される。
- これらの知見に基づき、著者らは SciLT を提案する。SciLT は、適応的特徴融合とデュアル・スーパービジョンを用いて、直前層と最終層の表現を組み合わせる。
- SciLT は、頭部クラスと尾部クラスの双方にわたってよりバランスの取れた精度を達成し、大きなドメインシフトを伴う科学の長尾タスクに基盤モデルを適応させる際の、より強力なベースラインを確立する。


