要旨: マルチモーダル・フェデレーテッド・ラーニング(MMFL)は、プライバシーを保った協調的な学習を可能にしますが、実世界の臨床応用では、センサの間欠稼働や不規則なサンプリングに起因する、同一モダリティ内の欠測(within-modality missingness)によってしばしば性能が損なわれます。既存手法は、建築的な整合(architectural alignment)や欠測埋め込み(missing embeddings)によって、観測されていないデータを暗黙的に表現することが多いものの、真の分布を復元できず、その結果、性能が最適にならないことがあります。本研究では、条件付き拡散モデルを用いてこの欠測を明示的に扱うフェデレーテッド・フレームワーク「CondI」を提案します。CondIは二段階の学習パイプラインを採用します。第一段階では、利用可能なマルチモーダル文脈と条件付き埋め込みを用いて、観測されていない時間的成分を補完します。第二段階では、モダリティ固有の抽出器と、共同の埋め込み空間を最適化します。推論時には、補完された生データを学習済みの抽出器に入力し、頑健な特徴を生成して、下流タスクに対する全体的な表現を提供します。明示的なデータ補完により、モデルは完全な意味構造の上で動作できるため、データの不完全性が深刻な場合に対する耐性が大幅に向上します。3つの臨床データセット(PTB-XL、SLEEP-EDF、MIMIC-IV)での実験により、CondIが最先端のベースラインと同等の結果を達成することが示されます。コード: https://github.com/ZhengWugeng/CondI
マルチモーダル・フェデレーテッド学習における同一モダリティ内欠損に対する条件付き補完
arXiv cs.LG / 2026/4/28
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- 本論文は、センサの途切れや不規則なサンプリングによって生じる「同一モダリティ内の欠損」という、臨床データにおけるマルチモーダル・フェデレーテッド学習の典型的な課題を扱う。
- 既存手法がアーキテクチャの整合や欠損埋め込みに暗黙的に依存するため、真のデータ分布を十分に復元できず性能が低下しうる点を指摘している。
- 提案手法CondIは、条件付き拡散モデルを用いて、2段階の学習パイプライン(まずマルチモーダル文脈と条件付き埋め込みで欠損する時間成分を補完し、その後モダリティ固有の抽出器と結合埋め込み空間を学習)を行う。
- 推論では補完した生データを学習済み抽出器に通して頑健な特徴を生成し、下流タスクでの欠損耐性を高める。
- PTB-XL、SLEEP-EDF、MIMIC-IVの3つの臨床データセットで、CondIは最先端ベースラインと同等の性能を示し、著者はGitHubでコードも公開している。



