概要: 2型糖尿病の症例報告は複雑な臨床経過を描写しますが、そのタイムラインはしばしば、縦断モデリングで再利用しにくい言語で表現されています。このギャップに対処するため、私たちは、グルカゴン様ペプチド1受容体作動薬に関するPubMed Open Accessの単一患者症例報告136件を対象としたテキスト時系列コーパスを開発し、臨床イベントをその最も確からしい参照時刻に紐づけました。私たちは、ゴールドスタンダードのタイムライン(臨床領域の専門家が注釈したもの)に対して、LLMによる自動タイムライン抽出を評価し、システムが臨床イベントとそのタイミングをどれほど正確に回復できるかを検討しました。最も性能の高いLLMは、イベントの網羅率が高く(GPT5; 0.871)、症状(GPT5; 0.843)にまたがって、さらに診断、治療、検査、転帰においても信頼性の高い時間的な順序付けを実現しました。下流タスクとしての実演では、糖尿病におけるイベントまでの期間分析により、GLP-1使用者は非使用者に比べて呼吸器の続発症リスクが低いことが示されました(HR=0.259、p<0.05)。これは、呼吸器アウトカムが改善するとした先行報告と整合しています。時間注釈とコードは採択後に公開します。
大規模言語モデルによるGLP-1RA症例の時系列フェノタイピング:テキスト時系列コーパスとリスクモデリング
arXiv cs.CL / 2026/4/9
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、136件のPubMed Open Accessに収載された単一患者のGLP-1RA症例報告から構築したテキスト時系列コーパスを紹介し、物語形式のタイムラインを縦断的なリスクモデリングでより使いやすくすることを目的としている。
- 専門家が注釈したゴールドスタンダードのタイムラインに対して、大規模言語モデルに基づく自動タイムライン抽出を評価し、出来事の回収(イベント回復)と時間的順序の正確性の両方に焦点を当てている。
- 最も良い性能を示したシステムは、症状、診断、治療、検査、および転帰にまたがる臨床イベントとそれらの時間的な並び順の回収において高い性能を示す。
- 下流タスクの例として、イベントまでの時間(time-to-event)解析により、GLP-1使用者は非使用者よりも呼吸器後遺症のリスクが低いことが示される(HR 0.259、p<0.05)。これは先行研究の結果と整合している。
- 著者らは、採択後に時間的注釈とコードを公開し、データセットおよび手法を再利用可能にする計画である。
