PepBenchmark: ペプチド機械学習のための標準化ベンチマーク
arXiv cs.LG / 2026/4/14
📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research
要点
- 本論文では、ペプチドMLにおける共通で比較可能な評価基準の欠如に対処することで、ペプチド創薬を加速することを目的とした標準化ベンチマークスイート「PepBenchmark」を提案する。
- PepBenchmarkには、7つのグループにまたがる29の正準(canonical)ペプチドデータセットと6つの非正準(non-canonical)ペプチドデータセットを含むPepBenchData、統一された前処理/分割/特徴変換のための標準化PepBenchPipeline、ならびに統一的な評価のためのPepBenchLeaderboardが含まれる。
- リーダーボードは、方法論の4つの主要ファミリー――Fingerprint(指紋)ベース、GNNベース、PLMベース、SMILESベースのモデル――を対象とし、公正な比較を可能にする強力なベースライン手法を備えている。
- 著者らは、PepBenchmarkがペプチド創薬に向けたAI利用可能なデータセット資源として現時点で最も包括的であると主張し、GitHubを通じて公開データおよびコードを提供する。




