CGM-JEPA:予測的自己教師あり事前学習によって一貫した連続血糖モニタ表現を学習する

arXiv cs.LG / 2026/5/5

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • この論文では、連続血糖モニタ(CGM)の生データ(血糖値)ではなく、マスクした潜在表現を予測する自己教師あり事前学習フレームワーク「CGM-JEPA」を提案する。
  • CGMの表現学習における2つの連動課題(同一の生理状態が複数の視点で観測されるため単一視点表現が転移しにくいこと、モダリティ変化で基準手法の性能が不安定になること)に対処する。
  • 「X-CGM-JEPA」では、補完的な分布情報を得るために、マスク付きのGlucodensityクロスビュー目的を追加する。
  • 事前学習は約389k件のラベルなしCGM読み取り(228名)で行い、AUROCを用いて3つの評価レジーム(コホート汎化、静脈OGTT→CGM移行、家庭用CGM)で検証する。
  • 最強のベースラインと比べて、X-CGM-JEPAはAUROCを最大+6.5pp(コホート汎化)および+3.6pp(静脈→CGM移行)改善し、モダリティ変化下でサブグループ間のAUROCギャップを縮小させる。

Abstract

連続血糖モニタリング(CGM)は、早期の代謝サブフェノタイプ(インスリン抵抗性、IR;eta細胞機能不全)を検出できますが、人口規模での導入には2つの連動した問題があります。第一に、同一の生理状態が複数の見え方を通じて現れるため(CGM時系列、静脈OGTT、Glucodensityの要約)、単一視点の表現は、導入によりモダリティや設定が変わると転移できません。第二に、これらの変化にまたがってベースラインの性能が一貫しません。両方の問題が示す解決策は1つです。すなわち、単一の見え方に依存せずに、より高次の時間的・分布的構造を捉える表現です。私たちは、マスクした潜在表現を生の値ではなく予測する自己教師あり事前学習フレームワークであるCGM-JEPAを提案し、モダリティ間で転移可能な抽象化を実現します。X-CGM-JEPAは、補完的な分布情報のために、マスクしたGlucodensityのクロスビュー目的を追加します。私たちは、228名の被験者から得た約389k件の未ラベルCGM読み取りで事前学習し、2つの臨床コホート(N=27およびN=17の公開リリース部分集合)を、3つのレジーム(コホートの一般化、静脈からCGMへの転移、自宅でのCGM)で評価します。評価は20イテレーション×2分割交差検証のもとで行います。X-CGM-JEPAは、3つすべてのレジームにおける両方のエンドポイントでAUROCが1位または2位となり、いかなるベースラインもこれを達成できません。最強のベースラインを、コホートの一般化で最大+6.5pp、静脈からCGMへの転移で最大+3.6pp上回ります(対応のあるWilcoxon、p<0.001)。モダリティシフト下では平均AUROCが一致しつつ、より弱いサブグループへ分布が再配置されます(民族のAUROCギャップは25-54%縮小)。同一ドメインの静脈データが疎な場合、分布的ビューがラベルに配慮したクラスタリングを押し上げます(ARI +39 ext%、NMI +40 ext%)。コードと重み: https://github.com/cruiseresearchgroup/CGM-JEPA