告知タイプ: 新規
要約: 前臨床データから患者の薬物応答を予測することは、in vitro の細胞株と患者腫瘍との間に大きな生物学的ギャップがあるため、精密腫瘍学における重大な課題である。絶対的な in vitro 予測精度の向上を目指すのではなく、本研究は、表現学習とタスク監督を明示的に分離することが、生物学的ドメインシフトが強い状況下で、薬物応答モデルを患者データへよりサンプル効率よく適応させることを可能にするかどうかを検討する。大規模なラベルなしの薬物ゲノミクスデータの集合から、自己符号化器ベースの表現学習を用いて、細胞表現と薬物表現をまず独立に学習するという段階的な転移学習フレームワークを提案します。これらの表現は次に、細胞株データ上の薬物応答ラベルと整合させられ、その後、few-shot 学習を用いて患者腫瘍へ適応されます。ドメイン内、データセット間、患者レベルの設定を網羅する体系的評価を通じて、ソースドメインとターゲットドメインが大きく重なる場合には、教師なし事前学習の効果は限られている一方、非常に限られたラベル付きデータで患者腫瘍へ適応する場合には明確な利点を生むことを示します。特に、提案されたフレームワークは、few-shot の患者レベル適応時により高速な性能改善を達成しつつ、標準的な細胞株ベンチマークにおいて単一フェーズのベースラインと同等の精度を維持します。全体として、ラベルなしの分子プロファイルから構造化され移転可能な表現を学ぶことは、効果的な薬物応答予測に必要な臨床監視の量を大幅に削減する可能性を示しており、データ効率のよい前臨床から臨床への翻訳へ向けた実践的な道筋を提供します。
強い生物学的ドメインシフト下での患者腫瘍への薬物応答モデルのサンプル効率の高い適応
arXiv cs.LG / 2026/3/18
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、強い生物学的ドメインシフト下で患者腫瘍へ薬物応答モデルを適用する際のサンプル効率を向上させるため、表現学習をタスク監督から明確に分離する段階的転移学習フレームワークを提案する。
- まず、細胞表現と薬物表現を大規模なラベルなしの薬物ゲノムデータから自動エンコーダベースの学習を用いて独立に学習し、次にこれらの表現を細胞株上の薬物応答ラベルと整合させてから、患者腫瘍への適応を少数ショット監督で行う。
- 同一ドメイン内、クロスデータセット、患者レベルの設定における体系的な実験では、教師なし事前学習はソースドメインとターゲットドメインが重なる場合には限定的な効果しかなく、ラベル付きデータが非常に限られている患者腫瘍への適応には明確な利得を生む。
- 本フレームワークは、少数ショットの患者レベル適応時により速い性能向上を達成しつつ、標準的な細胞株ベンチマークで単一段階のベースラインと同等の精度を維持し、データ効率の高い前臨床から臨床への翻訳を示している。
- 全体として、本研究は、ラベルなしの分子プロファイルから構造化され、転移可能な表現を学習することが、薬物応答予測における臨床監視の必要性を大幅に減らすことを示している。
