要旨: 人の健康状態が時間とともにどのように変化するのか、また介入への反応が個人間でなぜ異なるのかを理解することは、医学における中心的な課題であり続けています。ここでは、15,000人超の深い表現型(phenotyping)を持つ個人からなる複数回受診コホートである Human Phenotype Project のデータで学習することにより、人間の生理学的な軌跡を生成的にモデル化する、デコーダのみのトランスフォーマーである HealthFormer を提示します。私たちは、各参加者の健康軌跡を、7つの領域にまたがる667の計測値にわたってトークン化します。すなわち、血液バイオマーカー、身体組成、睡眠生理、持続血糖モニタリング、腸内細菌叢、ウェアラブル由来の生理、そして行動と服薬曝露です。私たちは HealthFormer を、これらの領域にまたがる個々の生理学的軌跡を予測するように学習し、この単一の生成目的から、臨床的に関連するさまざまなタスクをモデルへのクエリとして表現できることを示します。タスク固有の学習を行わなくても、HealthFormer が4つの独立コホートへ転移し、30の発症疾患および死亡エンドポイントのうち27で予測を改善すること、さらにすべての比較において確立された臨床リスクスコアを上回ることを示します。さらに、モデルがシミュレーション(in silico)で介入を再現できることも示します。保持アウト(held-out)されたパーソナライズド栄養の試験では、介入条件付きの予測によって、個々の6か月間のバイオマーカー変化が回復されます(例:拡張期血圧に対して Pearson の r = 0.78)。公表された試験から抽出した41件のランダム化介入・アウトカム比較において、私たちの結果は、効果の予測される方向が常に一致し、予測された平均が30件中30件ではなく、報告された95%信頼区間の範囲内に入ることが30件で示されます。私たちは HealthFormer を、予測、リスク層別化、介入条件付きシミュレーションがクエリとして生じる初期の「ヘルス・ワールドモデル」と位置づけ、臨床デジタルツインのための基盤を提供します。
人間の生理を生成的マルチモーダルモデルでシミュレーションし、臨床的介入を再現する
arXiv cs.AI / 2026/5/1
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- この論文は、Human Phenotype Projectのデータを用いて個人の生理学的トラジェクトリを生成的にモデル化するデコーダーのみのトランスフォーマ「HealthFormer」を提案している。
- 研究では、患者の複数回受診に基づく深い表現型データをトークン化し、血液バイオマーカー、身体組成、睡眠生理、持続血糖モニタリング、腸内細菌叢、ウェアラブル由来生理、行動・服薬曝露の7つの領域・計667の測定指標にわたって将来の変化を予測するよう訓練している。
- タスク固有の追加学習なしで、HealthFormerは4つの独立コホートへ転移し、30の疾病・死亡エンドポイントのうち27で既存の臨床リスクスコアを上回る改善を示したとしている。
- さらに、介入のインシリコ(in silico)シミュレーションも示されており、個別化栄養介入の試験設定では、介入条件付き予測が6か月のバイオマーカ変化を個人ごとに再現し(例:拡張期血圧でPearson r=0.78)、公表されたランダム化試験の41件の比較でも効果の方向性が一致し、95%信頼区間内に平均予測が収まった症例が30件だったとしている。
- 本研究は、HealthFormerを「ヘルス・ワールドモデル」の初期形として位置づけ、予測、リスク層別化、介入条件付きシミュレーションをクエリとして実現し、臨床デジタルツインの基盤になり得ると述べている。




