マルチモーダルな臨床データにおける共有表現とタスク固有表現の分解

arXiv cs.LG / 2026/5/6

📰 ニュースModels & Research

要点

  • この論文は、複数アウトカムの予測において、アウトカム間で共有される情報と各アウトカムに固有の信号をより適切に分離するマルチタスクの枠組みを提案します。
  • Orthogonal Task Decomposition(OrthTD)により、患者表現を共有サブスペースとタスク固有サブスペースに分割し、幾何学的な直交性制約で冗長性を減らして負の転移を抑えることを狙います。
  • 実装は、マルチモーダル融合のための統一Transformer上に構築されており、共有表現学習とアウトカム固有モデリングのバランスを取ろうとしています。
  • 実データとして手術患者12,430名のコホートで4つのアウトカムを予測し、平均AUC 87.5%、平均AUPRC 37.2%を達成、特にクラス不均衡下での希少イベント検出に関するAUPRCの改善が大きいと報告されています。
  • 共有表現とタスク固有表現の非冗長性を強制することで、複雑なマルチモーダル臨床データからのマルチアウトカム予測が向上し得ることを示唆しています。

要旨: 実世界の臨床データは本質的にマルチモーダルであり、複数の関連するアウトカムを共同で評価するという実務上の必要性を反映する相補的な根拠を提供します。マルチタスク学習はアウトカム間で情報を共有することで効率を高められるものの、既存の手法は共有表現学習とアウトカム固有のモデリングのバランスを取れないことが多いです。ハード・パラメータ共有は、タスクの勾配が競合する場合にネガティブ・トランスファーを引き起こし得ます。一方で、柔軟な共有は共有シグナルとタスク固有シグナルをなおも絡め合わせてしまう可能性があります。これに対処するために、本研究では、マルチモーダル融合のための統一Transformerに基づくマルチタスクの枠組みを提案し、さらに患者表現を共有部分とタスク固有部分の部分空間に分解するための直交タスク分解(OrthTD)を加えます。そして、冗長性を減らしタスク固有シグナルを分離するために幾何学的な直交性の制約を課します。OrthTDを、4つのアウトカムを予測するための実世界の外科患者コホート(12,430人)で評価しました。OrthTDは平均AUC(受信者動作特性曲線下面積)87.5%および平均AUPRC(精度-再現率曲線下面積)37.2%を達成し、高度な表形式手法およびマルチタスク手法を一貫して上回りました。とりわけOrthTDはAUPRCにおいて大きな改善を示しており、不均衡な臨床データの中で希少な事象を同定する性能が優れていることを示唆します。これらの結果は、冗長でない共有表現とタスク固有表現を強制することで、マルチモーダルな臨床データから複数アウトカムの予測を改善できることを示しています。