糖尿病の時系列データを管理するための統一データ形式:DIAbetes eXchange(DIAX)

arXiv cs.LG / 2026/4/15

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsIdeas & Deep AnalysisTools & Practical Usage

要点

  • この記事では、CGM(持続血糖モニタ)、スマートインスリンペン、ならびに自動インスリン投与システムといったデバイスから得られる糖尿病の時系列データを統合するための、標準化されたJSONベースのデータ形式であるDIAXを提案する。
  • 一貫した入力データに依存する研究ワークフローや機械学習パイプラインにとって特に有益であることを意図しつつ、相互運用性、再現性、拡張性の向上を目指す。
  • DIAXはデータホスティングプラットフォームという位置づけではなく、(変換/可視化のためのツールを備えた)翻訳可能で相互運用可能なリソースとして提示され、データ共有に伴う硬直した制約を回避するのに役立つ。
  • リポジトリは変換ツールおよびフォーマット間の互換性をサポートしており、すでに主要な複数のデータセットと互換性があり、合計で1,000万患者時(10 million patient-hours)を超える。
  • 全体として、本研究は、研究間でのデータセット共有と統合をより容易にしつつ、形式を拡張するためのコミュニティ貢献も支援することを目的としている。

Abstract

糖尿病デバイス(連続血糖モニタリング(CGM)、スマートインスリンペン、自動インスリン投与システムを含む)は、研究や機械学習で広く用いられる豊富な時系列データを生成します。しかし、情報源ごとにデータ形式が一貫していないことが、共有・統合・解析の妨げになっています。 本稿では、CGM、インスリン、食事の信号を含む糖尿病の時系列データを統一するための、標準化されたJSONベースの形式であるDIAX(DIAbetes eXchange)を提案します。DIAXは、特に機械学習用途において、相互運用性,再現性,拡張性を促進します。オープンソースのリポジトリでは、データセット変換、クロス形式の互換性、可視化、ならびにコミュニティによる貢献のためのツールを提供します。DIAXはデータホスティングではなく、翻訳可能な(トランスレーショナルな)リソースであるため、データ共有の制約を課すことなく柔軟性を確保します。 現在、DIAXは他の標準化の取り組みと互換性があり、主要なデータセット(DCLP3、DCLP5、IOBP2、PEDAP、T1Dexi、Loop)をサポートしており、合計で1,000万患者時間を超えるデータを扱っています。 https://github.com/Center-for-Diabetes-Technology/DIAX

糖尿病の時系列データを管理するための統一データ形式:DIAbetes eXchange(DIAX) | AI Navigate