要旨: 合成致死(SL)の正確な予測は、がん薬および治療法の開発を導くために重要である。SL予測は、異種のマルチソースデータを効果的に統合することにおいて重大な課題に直面している。既存のマルチモーダル手法はしばしば、「モダリティの怠慢(modality laziness)」に悩まされる。これは、収束速度が異なることによって相補的情報の活用が妨げられるためである。これはまた、既存のSL予測モデルの多くが、汎がん(pan-cancer)と単一がん(single-cancer)の両方のSLペア予測を同時にうまく行えない主な理由でもある。本研究では、汎がん文脈と単一がん文脈の双方にわたるSL予測のためのデュアルステージ・マルチモーダル融合フレームワークであるSynLeaFを提案する。このフレームワークは、4種類のオミックスデータ(遺伝子発現、変異、メチル化、CNV)を融合するために、専門家の積(product of experts)メカニズムを備えたVAEベースのクロスエンコーダを用いる。同時に、生物医学知識グラフから構造化された遺伝子表現を捉えるために、リレーショナルグラフ畳み込みネットワークを利用する。モダリティの怠慢を緩和するために、SynLeaFは、適応的な単一モダリティ教師およびアンサンブル戦略を用いた、特徴レベルの知識蒸留を行うデュアルステージの学習機構を導入する。8つの特定のがん種および汎がんデータセットにわたる大規模実験において、SynLeaFは19のシナリオ中17で優れた性能を達成する。アブレーション研究および勾配解析はさらに、提案した融合および蒸留メカニズムがモデルの頑健性と汎化性能にとって重要な寄与をすることを裏付ける。コミュニティでの利用を容易にするため、https://synleaf.bioinformatics-lilab.cn にウェブサーバーを用意している。
SynLeaF:汎がんおよび単一がんの文脈にまたがる合成致死予測のためのデュアルステージ・マルチモーダル融合フレームワーク
arXiv cs.AI / 2026/3/25
💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- 本研究は、汎がんおよび単一がんの両設定において、異種のオミックスデータを効果的に統合することで合成致死(SL)予測を改善することを目的とした、デュアルステージのマルチモーダル融合フレームワーク「SynLeaF」を提案する。
- SynLeaFは、4種類のオミックス(遺伝子発現、変異、メチル化、CNV)を、積の専門家(product-of-experts)アプローチに基づくVAEベースのクロスエンコーダで融合しつつ、生物医学的知識グラフ上でのリレーショナルグラフ畳み込みネットワークも活用する。
- 「モダリティの怠惰(modality laziness)」への対処として、本手法は適応的な単一モーダル教師による特徴レベルの知識蒸留と、モダリティ間の収束バランスを取るアンサンブル戦略を用いたデュアルステージ学習を行う。
- 8種類のがんタイプに加えて汎がんデータセットを対象とした実験により、SynLeaFは19シナリオ中17で従来手法を上回り、アブレーション実験および勾配解析によって、融合/蒸留コンポーネントの頑健性と汎化への寄与が支持される。
- 著者らは、SynLeaFを合成致死予測に利用できるコミュニティアクセス可能なWebサーバを提供している(https://synleaf.bioinformatics-lilab.cn)。
