Abstract
連続血糖モニタリング(CGM)は、早期の代謝サブフェノタイプ(インスリン抵抗性、IR;eta細胞機能不全)を検出できますが、人口規模での導入には2つの連動した問題があります。第一に、同一の生理状態が複数の見え方を通じて現れるため(CGM時系列、静脈OGTT、Glucodensityの要約)、単一視点の表現は、導入によりモダリティや設定が変わると転移できません。第二に、これらの変化にまたがってベースラインの性能が一貫しません。両方の問題が示す解決策は1つです。すなわち、単一の見え方に依存せずに、より高次の時間的・分布的構造を捉える表現です。私たちは、マスクした潜在表現を生の値ではなく予測する自己教師あり事前学習フレームワークであるCGM-JEPAを提案し、モダリティ間で転移可能な抽象化を実現します。X-CGM-JEPAは、補完的な分布情報のために、マスクしたGlucodensityのクロスビュー目的を追加します。私たちは、228名の被験者から得た約389k件の未ラベルCGM読み取りで事前学習し、2つの臨床コホート(N=27およびN=17の公開リリース部分集合)を、3つのレジーム(コホートの一般化、静脈からCGMへの転移、自宅でのCGM)で評価します。評価は20イテレーション×2分割交差検証のもとで行います。X-CGM-JEPAは、3つすべてのレジームにおける両方のエンドポイントでAUROCが1位または2位となり、いかなるベースラインもこれを達成できません。最強のベースラインを、コホートの一般化で最大+6.5pp、静脈からCGMへの転移で最大+3.6pp上回ります(対応のあるWilcoxon、p<0.001)。モダリティシフト下では平均AUROCが一致しつつ、より弱いサブグループへ分布が再配置されます(民族のAUROCギャップは25-54%縮小)。同一ドメインの静脈データが疎な場合、分布的ビューがラベルに配慮したクラスタリングを押し上げます(ARI +39 ext%、NMI +40 ext%)。コードと重み: https://github.com/cruiseresearchgroup/CGM-JEPA