MAT-Cell:バッチレベルの単一細胞アノテーションのためのマルチエージェント木構造推論フレームワーク

arXiv cs.AI / 2026/4/10

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、分布外の細胞状態やノイズの多いトランスクリプトーム信号において、教師ありモデルやLLMが抱える失敗に対処する、バッチレベルの単一細胞アノテーションのための神経記号論的マルチエージェント木構造推論フレームワーク「MAT-Cell」を提案する。
  • MAT-Cellは、ブラックボックス分類から、生物学的公理に基づく適応的なRetrieval-Augmented Generation(RAG)によってシンボリックな制約を注入し、構成的で検証可能な証明生成へと転換する。
  • 同質の反論エージェントによる弁証法的検証メカニズムを用いて推論経路を監査し、不要な経路を剪定することで、論理的一貫性を保証する三段論法の派生木(シロジスティック導出ツリー)を生成する。
  • 大規模で種をまたぐベンチマークでの実験により、MAT-Cellが最先端手法を上回り、基準手法が急激に劣化するような困難な設定でも頑健性を維持することが示される。
  • 著者らは、追試やさらなる実験を可能にするために、フレームワークのオープンソースコードリポジトリを提供している。

Abstract

自動化された細胞推論は、根本的な二分法に直面しています。教師あり手法は「参照トラップ(Reference Trap)」に陥り、分布外の細胞状態へ一般化できない一方で、大規模言語モデル(LLM)は、基盤となる生物学的事前知識(grounded biological priors)がないために「信号対雑音パラドックス(Signal-to-Noise Paradox)」を起こし、もっともらしい(spurious)関連を生成してしまいます。私たちはMAT-Cellを提案します。これは、単一細胞解析をブラックボックス分類から、構成的で検証可能な証明生成へと作り直す、神経記号(neuro-symbolic)推論フレームワークです。MAT-Cellは、適応的なRetrieval-Augmented Generation(RAG)を通じて記号的制約を注入し、神経推論を生物学的公理に基づけることで、トランスクリプトミクスのノイズを低減します。さらに、均質な反論エージェントによる弁証法的検証プロセスを採用し、推論経路を監査して剪定(prune)することで、論理一貫性を強制する三段論法的導出木(syllogistic derivation trees)を形成します。大規模かつ種をまたぐベンチマークにおいて、MAT-Cellは最先端(SOTA)モデルを大幅に上回り、ベースライン手法が深刻に劣化する難しい状況でも堅牢な性能を維持します。コードは https://gith ub.com/jiangliu91/MAT-Cell-A-Mul ti-Agent-Tree-Structured-Reasoni ng-Framework-for-Batch-Level-Sin gle-Cell-Annotation で入手できます。