ArcFace-Inception による ECG バイオメトリクス:MIMIC と HEEDB における外部検証

arXiv cs.LG / 2026/4/7

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、1D Inception-v1 モデルを大規模な内部臨床データセットで ArcFace により学習し(53,079 人の患者から 164,440 件の 12 誘導心電図)、ECG バイオメトリクスを評価する。さらに MIMIC-IV-ECG と HEEDB で外部テストを行う。
  • Rank@K と TAR@FAR を用いた統一的なクローズドセットの leave-one-out プロトコルにより、広く比較可能な条件下で同定可能性が強く示され、Rank@1 は 0.9506(ASUGI-DB)、0.8291(MIMIC-GC)、0.6884(HEEDB-GC)を達成する。
  • 時間的ストレス実験では、ギャラリーサイズを一定にしても年差が大きくなるにつれて性能が低下することが明らかになり、Rank@1 が例えば MIMIC で 0.7853→0.6433(1〜5 年)、HEEDB で 0.6864→0.5560 と低下する。
  • ギャラリーサイズおよびドメインの不均一性が運用品質に大きく影響する。HEEDB のスケールテストでは、ギャラリーが増えるほど単調に劣化し、患者ごとの検査数が増えると回復する。
  • 事後(ポストホック)による再ランキングは HEEDB-RR における検索を改善する。AS-norm によりベースラインの 0.7765 から Rank@1 が 0.8005 に向上し、スコア処理によってドメイン/スケール効果を部分的に緩和できることを示唆する。

Abstract

心電図(ECG)バイオメトリクスは主に小規模コホートおよび短いセッション間隔で研究されてきたため、大規模ギャラリー、外部ドメインシフト、ならびに複数年にわたる時間的ギャップのもとで同定がどのように振る舞うかは未解決のままである。本研究では、53,079人の患者から得られた164,440件の12誘導ECGから成る内部臨床コーパスで、ArcFaceにより学習した1D Inception-v1モデルを評価し、MIMIC-IV-ECGおよびHEEDBに由来するより大規模なコホートで検証した。研究は、Rank@KおよびTAR@FAR指標とともに、スケール、時間的ストレス、再ランキング、信頼性(confidence)分析を用いた統一されたクローズドセットのleave-one-out プロトコルで実施した。一般的な比較可能性のもとで、このシステムはASUGI-DBでRank@1が0.9506、MIMIC-GCで0.8291、HEEDB-GCで0.6884を達成した。ギャラリーサイズを一定にした時間的ストレステストでは、Rank@1は、MIMICで1年から5年の間に0.7853から0.6433へ、またHEEDBでは0.6864から0.5560へと低下した。HEEDBに対するスケール分析では、ギャラリーサイズが増加するにつれて単調な劣化が観察され、患者あたりの検査数が増えると回復した。HEEDB-RRにおいては、事後(post-hoc)の再ランキングにより検索がさらに改善され、AS-normは、0.7765という基準(ベースライン)からRank@1 = 0.8005へ到達した。したがって、ECGのアイデンティティ情報は、外部で検証された大規模なクローズドセット条件下でも測定可能であり続けるが、その運用上の品質は、ドメインの異質性、縦断的ドリフト、ギャラリーサイズ、ならびに第2段階のスコア処理の影響を強く受ける。