要旨: 本稿では、143の薬剤および薬剤候補分子からなる、唯一のマルチタスク・データセットを提示する。これらの分子は、6種類の異なるモデル膜を用いたin vitroの並列人工膜透過性アッセイ(PAMPA)によって評価されている。本リソースを用いて、受動的な膜透過性の予測における、さまざまな分子記述子および回帰モデルの有効性を体系的に評価する。対象とするモデルは、単純な線形回帰から最新の事前学習済みトランスフォーマー・アーキテクチャまで幅広い。特に、予測性能とモデルの解釈可能性のトレードオフに注目し、機械学習アプローチによってもたらされる課題を浮き彫りにする。筆者らの知る限り、本研究は、複数の臓器特異的なPAMPA膜を同時にモデル化する点において、これまでで最も包括的な調査であり、膜特異的な透過性プロファイルに関する新たな洞察を提供する。
専門家が設計した物理化学的特性の記述子は、深層学習に基づく表現よりも、限られたサンプルサイズの透過性研究に適していることが分かった。
ユニークなマルチタスクPAMPAデータセットに対するQSPR手法の比較研究
arXiv cs.LG / 2026/5/4
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文では、新たにマルチタスクPAMPAデータセットを提示し、143の分子について6種類のモデル膜でin vitroの受動的膜透過性を評価しています。
- 分子記述子のさまざまな組み合わせと回帰モデルを比較し、単純な線形回帰から事前学習済みのトランスフォーマーまでを対象にしています。
- 予測性能とモデル解釈可能性のトレードオフに重点を置き、とりわけ機械学習手法がもたらす課題を整理しています。
- 結果として、サンプル数が限られた透過性研究では、専門家設計の物理化学的記述子の方が深層学習表現より適している可能性が示されています。
- 複数の臓器特異的PAMPA膜を同時にモデル化したこれまでで最も包括的な研究だとしており、膜ごとの透過性プロファイルに関する新しい知見を提供します。



