A Multiparty Homomorphic Encryption Approach to Confidential Federated Kaplan Meier Survival Analysis

arXiv stat.ML / 4/14/2026

💬 OpinionIdeas & Deep AnalysisModels & Research

Key Points

  • 複数施設での生存データを集計できないプライバシー制約を背景に、閾値CKKS(threshold CKKS)に基づくプライバシー保護型のフェデレーテッド・Kaplan–Meier(KM)推定フレームワークを提案している。
  • 各サイトは共通の時間グリッド上で「リスク人数」や「イベント数」を計算して暗号化し、コーディネータが暗号文を集約、復号者委員会が部分復号シェアをブロック単位で統合して集計結果のみを復元することで、時間点ごとの個別テーブルの開示を避ける設計になっている。
  • 正しさ・安定性・スロット最適のベクトルパッキングについて理論的に示し、通信量がサイト数に対して線形、時間点数に対して予測可能に増えるスケーリング則も導出している。
  • 合成の乳がんデータ(N=60,000を500サイトに分散)で評価し、暗号化フェデレーテッド曲線がプールしたオラクルに数値精度レベルで一致することを報告している。
  • プレーンテキストの方式では単純な差分により再構成が可能になり得る点を踏まえ、脅威モデルの下でこの攻撃を閾値ゲート設計で妨げ、高忠実度な生存推定とオーバーヘッドの予測可能性を両立すると主張している。

Abstract

The proliferation of real-world health data enables multi-institutional survival studies, yet privacy constraints preclude centralizing sensitive records. We present a privacy-preserving federated Kaplan--Meier framework based on threshold CKKS (Cheon-Kim-Kim-Song) homomorphic encryption that supports approximate floating-point computation and encrypted aggregation of per-time-point counts while exposing only public outputs. Sites compute aligned at-risk and event tallies on a shared time grid and encrypt compact vectors; a coordinator aggregates ciphertexts; and a decryptor committee produces partial shares fused per block to recover aggregated plaintexts without releasing per-time-point tables. We prove correctness, stability, and slot-optimal vector packing, and derive scaling laws showing that communication grows linearly with the number of sites and predictably with the number of time points. Empirically, using synthetic breast-cancer data (N=60,000) distributed across 500 sites, encrypted federated curves match the pooled oracle to numerical precision. In contrast, plaintext protocols permit trivial reconstruction by subtraction; our threshold-gated design precludes this attack under the stated threat model, enabling high-fidelity survival estimation with predictable overhead and substantially reduced privacy risk.