要旨: バクテリオファージは、しばしば生物圏のダークマターと呼ばれますが、微生物生態系の調節や抗生物質の代替において重要な役割を担っています。したがって、ファージのゲノムを正確に解釈することは、大きな科学的および実用的価値を持ちます。汎用の大規模言語モデル(LLM)は生物学的テキストの理解に優れていますが、生のヌクレオチド配列を直接解釈し、生物学的な推論を行う能力については、十分に検討されていません。そこで本研究では、バイオインフォマティクスの専門家のワークフローを模倣することで、ファージゲノム理解を評価するために設計された最初のベンチマーク「PhageBench」を提案します。データセットには、スクリーニング、品質管理、表現型アノテーションの3つの段階にまたがる5つの中核タスクをカバーする、質の高い5,600件のサンプルが含まれています。8つのLLMに対する評価の結果、汎用の推論モデルは、ファージのコンティグ同定および宿主予測において、ランダムなベースラインを大幅に上回り、ゲノム理解に向けた有望な可能性が示されました。しかし一方で、長距離依存性や微細な機能の局在化を伴う複雑な推論タスクでは、顕著な制限も見られます。これらの知見は、生物学的配列に対する推論能力を高めた次世代モデルを開発する必要性を浮き彫りにしています。
PhageBench:LLMは生のバクテリオファージゲノムを理解できるのか?
arXiv cs.CL / 2026/4/8
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、専門的なバイオインフォマティクスのワークフローを用いて、LLMが生のバクテリオファージゲノムをどの程度理解できるかを評価するための新しいベンチマーク「PhageBench」を提案する。
- スクリーニング、品質管理、表現型注釈の3段階にまたがり、5つのタスクをカバーする5,600件の高品質なサンプルを提供する。
- 8つの汎用的なLLMを用いた実験では、ファージコンティグの同定や宿主予測といったタスクにおいて、ランダム基準を上回ることが示される。
- 本研究は、長距離の依存関係推論や、よりきめ細かな機能の局在化を必要とする要求度の高い問題において、顕著な弱点があることを明らかにする。
- 全体としての結果は、信頼できるゲノム解釈のためには、生物学的な配列推論がより強い次世代モデルが必要であることを示唆している。
