PepBenchmark: ペプチド機械学習のための標準化ベンチマーク

arXiv cs.LG / 2026/4/14

📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • 本論文では、ペプチドMLにおける共通で比較可能な評価基準の欠如に対処することで、ペプチド創薬を加速することを目的とした標準化ベンチマークスイート「PepBenchmark」を提案する。
  • PepBenchmarkには、7つのグループにまたがる29の正準(canonical)ペプチドデータセットと6つの非正準(non-canonical)ペプチドデータセットを含むPepBenchData、統一された前処理/分割/特徴変換のための標準化PepBenchPipeline、ならびに統一的な評価のためのPepBenchLeaderboardが含まれる。
  • リーダーボードは、方法論の4つの主要ファミリー――Fingerprint(指紋)ベース、GNNベース、PLMベース、SMILESベースのモデル――を対象とし、公正な比較を可能にする強力なベースライン手法を備えている。
  • 著者らは、PepBenchmarkがペプチド創薬に向けたAI利用可能なデータセット資源として現時点で最も包括的であると主張し、GitHubを通じて公開データおよびコードを提供する。