要旨: システマティックなアブレーションは、AI Virtual Cellsにおける性能向上を帰属させるために不可欠ですが、生物学的リポジトリが標準化されておらず、ドメイン固有のデータやフォーマットと密結合しているため、ほとんど実施されていません。近年のコーディングエージェントはアイデアを実装へ翻訳できますが、通常はコードを生成するところで止まってしまい、強力なベースラインを再現し、どの構成要素が本当に重要かを厳密に検証できる検証者(verifier)を備えていません。本研究では、この検証ギャップを埋める仮想細胞リポジトリ向けの、reproduce-then-ablate(再現してからアブレーションする)エージェントであるAblateCellを提案します。AblateCellはまず、環境を自動設定して依存関係やデータの問題を解決し、さらに公式評価を再実行しながら、検証可能な成果物を出力することで、報告されたベースラインをエンドツーエンドで再現します。次に、隔離されたリポジトリ改変のグラフを生成し、性能への影響と実行コストのトレードオフを行う報酬に基づいて実験を適応的に選択することで、クローズドループなアブレーションを実施します。単一細胞の摂動予測リポジトリ3件(CPA、GEARS、BioLORD)で評価したところ、AblateCellはエンドツーエンドのワークフロー成功率で88.9%(+29.9%:人間の専門家)を達成し、地に即した重要構成要素(ground-truth critical components)の回復において精度93.3%(+53.3%:ヒューリスティック)を達成しました。これらの結果により、生物学的コードベース上で、スケーラブルなリポジトリに根差した検証と帰属が実現できます。
AblateCell:仮想細胞リポジトリのための「再現してからアブレーションする」エージェント
arXiv cs.AI / 2026/4/22
📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research
要点
- AblateCellは、AI Virtual Cellsにおける性能向上の要因を特定するために、標準化不足でドメイン固有のデータや形式に密結合した生物学的リポジトリ上で、厳密なアブレーションと検証が行われにくいギャップを埋める「再現してからアブレーションする」エージェントです。
- まず、環境を自動設定して依存関係やデータの問題を解消し、公式評価をエンドツーエンドで再実行しつつ検証可能な成果物を出力することで、報告されたベースラインを再現します。
- 次に、分離したリポジトリ改変のグラフを作り、性能への影響と実行コストのバランスを考慮する報酬で実験を適応的に選択して、閉ループのアブレーションを実行します。
- 3つの単一細胞摂動予測リポジトリ(CPA、GEARS、BioLORD)で評価した結果、高いワークフロー成功率と、真の重要コンポーネントの復元精度の向上が示され、生物学的コードベース上でのスケーラブルな検証と帰属付けが可能になります。




