CARE-ECG: Causal Agent-based Reasoning for Explainable and Counterfactual ECG Interpretation

arXiv cs.LG / 4/14/2026

📰 NewsSignals & Early TrendsIdeas & Deep AnalysisModels & Research

Key Points

  • CARE-ECGは、既存のECG×LLMの弱い信号-テキスト対応や単なる検索に留まる点を補うため、因果構造を明示的に用いた説明可能なECG解釈フレームワークを提案している。
  • 多チャンネルECGを時間的に整理した潜在バイオマーカーとして表現し、因果グラフ推論による確率的診断と、推論過程を説明できる統合パイプラインを構成する。
  • 構造因果モデルにより反実仮想(what-if)解析を可能にし、代替的な生理状態が診断結果にどう影響するかを評価できる。
  • 言語出力は因果に基づくretrieval-augmented generationとモジュール型のエージェント的パイプライン、検証機構で基盤づけ(grounding)することで、ハルシネーションを抑えつつ説明の忠実性を高めることを目指している。
  • 複数のECGベンチマークや専門家QA設定で、Expert-ECG-QAで0.84、SCP-mapped PTB-XLで0.76(GPT-4)などの改善と説明のfaithfulness向上、ハルシネーション低減を報告している。

Abstract

Large language models (LLMs) enable waveform-to-text ECG interpretation and interactive clinical questioning, yet most ECG-LLM systems still rely on weak signal-text alignment and retrieval without explicit physiological or causal structure. This limits grounding, temporal reasoning, and counterfactual "what-if" analysis central to clinical decision-making. We propose CARE-ECG, a causally structured ECG-language reasoning framework that unifies representation learning, diagnosis, and explanation in a single pipeline. CARE-ECG encodes multi-lead ECGs into temporally organized latent biomarkers, performs causal graph inference for probabilistic diagnosis, and supports counterfactual assessment via structural causal models. To improve faithfulness, CARE-ECG grounds language outputs through causal retrieval-augmented generation and a modular agentic pipeline that integrates history, diagnosis, and response with verification. Across multiple ECG benchmarks and expert QA settings, CARE-ECG improves diagnostic accuracy and explanation faithfulness while reducing hallucinations (e.g., 0.84 accuracy on Expert-ECG-QA and 0.76 on SCP-mapped PTB-XL under GPT-4). Overall, CARE-ECG provides traceable reasoning by exposing key latent drivers, causal evidence paths, and how alternative physiological states would change outcomes.