生理学的に配慮したマスクド・クロスモーダル再構成によるバイオシグナル表現学習
arXiv cs.LG / 2026/5/5
📰 ニュースIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- 本論文は、自己教師ありバイオシグナル学習では、複数の体部位から得られる信号が共有する生理プロセスを反映しているにもかかわらず、信号間の方向性のある時間的ダイナミクスがしばしば無視されていると指摘する。
- ECG(心拍の電気的な開始)とPPG(末梢の脈拍が血管動態で遅れて現れる)など、時間的に順序づけられた信号を制約として用い、マスクド・クロスモーダル再構成を行う事前学習フレームワークxMAEを提案する。
- 実験の結果、xMAEで事前学習した表現は、19の下流タスク中15で単一モダリティおよびマルチモーダルのベースラインより優れ、心血管アウトカム予測、異常な検査の検出、睡眠ステージング、人口統計推定などを含むことが示される。
- 手法は、デバイス、体の部位、取得条件にまたがって一般化でき、さらに分析によりECG–PPGのタイミング構造が学習されたPPG表現に反映されることが示唆される。
- 著者らは、同一の基礎となる生理プロセスの異なる段階を観測する場合に、マルチモーダル事前学習へ時間構造を組み込むことが有効だと結論づけ、GitHubでコードを公開している。




