CHIMERA-Bench: エピトープ特異的抗体設計のベンチマークデータセット

arXiv cs.LG / 2026/3/17

📰 ニュースTools & Practical UsageModels & Research

要点

  • CHIMERA-Benchは、エピトープ条件付けされたCDR配列・構造の協同設計のための統一されたベンチマークを提供し、抗体設計ベンチマークにおける標準化の欠如に対応します。
  • エピトープおよびパラトープ注釈を備えた2,922件の抗体–抗原複合体を整理・収集し、標準化された評価を可能にします。
  • 生物学的動機づけを持つ3つのデータ分割(未知のエピトープ、未知の抗原フォールド、将来時点のターゲット)を定義し、一般化を評価します。
  • 5つの指標グループを含む包括的な評価プロトコルを提供し、新規のエピトープ特異性指標を含み、コミュニティ利用のためGitHubにコードとデータを公開しています。

概要:計算的抗体設計は、過去3年間に多数の深層生成法が提案されるなど急速な方法論的進展を遂げてきたが、公正な比較とモデル開発のための標準化されたベンチマークが欠如している。これらの方法は異なるSAbDabスナップショット、重複のないテストセット、互換性のない指標で評価され、設計問題を共通の定義を欠く多数のサブタスクに分解する文献が散見される。われわれは \textsc{Chimera-Bench} (\textbf{C}DR \textbf{M}odeling with \textbf{E}pitope-guided \textbf{R}edesign) を導入する。単一の標準タスクを核とした統一ベンチマークである:\emph{epitope-conditioned CDR sequence-structure co-design}。\textsc{Chimera-Bench} は (1) エピトープとパラトープのアノテーションを含む、キュレーション済みで重複排除された \textbf{2,922} の抗体-抗原複合体データセット;(2) 未知のエピトープ、未知の抗原フォールド、将来の時系列ターゲットへの一般化を評価する3つの生物学的動機づけの分割;(3) 新規エピトープ特異性指標を含む5つの指標群からなる総合的な評価プロトコル。われわれは、さまざまな生成パラダイムにまたがる代表的な手法をベンチマークし、すべてのスプリットにわたって結果を報告する。\textsc{Chimera-Bench} は抗体設計問題において同種の最大規模のデータセットであり、コミュニティが新規手法を開発・評価し、その一般化能力を評価することを可能にする。ソースコードとデータは以下で入手可能です:https://github.com/mansoor181/chimera-bench.git