BioAlchemy:生物学的文献を推論に適した強化学習トレーニングデータへ蒸留する
arXiv cs.AI / 2026/4/7
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、生物学分野の大規模推論データセットが、現在の生物学研究トピックの分布と十分に整合していないため、生物学タスクにおける推論モデルの性能を低下させ得ると主張している。
- 生物学研究文献から、多様で検証可能な生物学の設問—回答ペアを抽出し、強化学習に利用できる形にするパイプラインとしてBioAlchemyを提案する。
- 著者らはBioAlchemy-345K(生物学の推論問題34.5万件を含むデータセット)を公開し、データセットのトピック構成を現代の生物学に合わせることで、強化学習の成果が向上することを示す。
- さらに、生物学ベンチマークにおいて基盤モデルに対して9.12%の改善を達成する8B推論モデルの変種BioAlchemist-8Bも提示する。
- 得られたモデルはHugging Faceで公開されており、下流の研究者やチームが生物学に特化した推論システムをさらに構築できるようになる。




