生理学的に配慮したマスクド・クロスモーダル再構成によるバイオシグナル表現学習

arXiv cs.LG / 2026/5/5

📰 ニュースIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • 本論文は、自己教師ありバイオシグナル学習では、複数の体部位から得られる信号が共有する生理プロセスを反映しているにもかかわらず、信号間の方向性のある時間的ダイナミクスがしばしば無視されていると指摘する。
  • ECG(心拍の電気的な開始)とPPG(末梢の脈拍が血管動態で遅れて現れる)など、時間的に順序づけられた信号を制約として用い、マスクド・クロスモーダル再構成を行う事前学習フレームワークxMAEを提案する。
  • 実験の結果、xMAEで事前学習した表現は、19の下流タスク中15で単一モダリティおよびマルチモーダルのベースラインより優れ、心血管アウトカム予測、異常な検査の検出、睡眠ステージング、人口統計推定などを含むことが示される。
  • 手法は、デバイス、体の部位、取得条件にまたがって一般化でき、さらに分析によりECG–PPGのタイミング構造が学習されたPPG表現に反映されることが示唆される。
  • 著者らは、同一の基礎となる生理プロセスの異なる段階を観測する場合に、マルチモーダル事前学習へ時間構造を組み込むことが有効だと結論づけ、GitHubでコードを公開している。

Abstract

体の異なる部位から取得されたバイオシグナルは、多くの場合、同一の基礎的な生理プロセスを時間的に順序づけた視点として捉えます。しかし、既存の自己教師あり学習のほとんどの手法は、これらのシグナルを入れ替え可能な見方として扱い、両者を結びつける方向性のある時間的ダイナミクスを見落としています。典型的な例は、各心拍の開始となる電気的活性を捉える心電図(ECG)と、血管ダイナミクスによって遅れて記録される、その結果としての末梢パルスを記録する光電容積脈波(PPG)の関係です。このような構造化された関係を捉えるために、本研究では xMAE を提案します。xMAE は、時間的に順序づけられたバイオシグナル間でのマスク付きクロスモーダル復元を活用し、学習時の時間制約として用いることで、学習された表現に生理学的に意味のあるタイミング構造を促すバイオシグナル事前学習フレームワークです。xMAE による事前学習は、心血管アウトカム予測、異常な検査項目の検出、睡眠ステージング、人口統計推論などを含む 19 個中 15 個の下流タスクにおいて、単一モーダルおよびマルチモーダルの両方のベースラインを上回る表現をもたらすことを示します。さらに、デバイス、身体部位、取得設定にまたがって汎化可能であることも確認されます。追加の分析から、ECG と PPG のタイミング構造が、学習された PPG 表現に反映されていることが示唆されます。より広く言えば、共有された基礎プロセスの異なる段階を観測するマルチモーダルなシグナルに対して、時間的構造をマルチモーダル事前学習に組み込むことの有効性を、xMAE は示しています。コードは https://github.com/hzhou3/xMAE で利用可能です。