PepBenchmark: ペプチド機械学習のための標準化ベンチマーク

arXiv cs.LG / 2026/4/14

📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research

共有:

要点

本論文では、ペプチドMLにおける共通で比較可能な評価基準の欠如に対処することで、ペプチド創薬を加速することを目的とした標準化ベンチマークスイート「PepBenchmark」を提案する。
PepBenchmarkには、7つのグループにまたがる29の正準（canonical）ペプチドデータセットと6つの非正準（non-canonical）ペプチドデータセットを含むPepBenchData、統一された前処理/分割/特徴変換のための標準化PepBenchPipeline、ならびに統一的な評価のためのPepBenchLeaderboardが含まれる。
リーダーボードは、方法論の4つの主要ファミリー――Fingerprint（指紋）ベース、GNNベース、PLMベース、SMILESベースのモデル――を対象とし、公正な比較を可能にする強力なベースライン手法を備えている。
著者らは、PepBenchmarkがペプチド創薬に向けたAI利用可能なデータセット資源として現時点で最も包括的であると主張し、GitHubを通じて公開データおよびコードを提供する。

AI Business

AI Business

Publickey

日経XTECH

日経XTECH