ISAAC:創薬標的相互作用における深層モデルの因果推論を監査する

arXiv cs.LG / 2026/5/6

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • ISAACは、創薬標的相互作用(DTI)向けの深層学習モデルが、見せかけの相関ではなく機構的に意味のある分子特徴に依存しているかを検証するための事後的監査フレームワークである。
  • 凍結したモデルに対して、機構的な構造特徴とスプリアスな入力特徴をそれぞれ狙った対応する介入(インターベンション)でプロービングし、予測精度とは独立に評価する。
  • Davisベンチマークで配列ベースのDTIアーキテクチャ3種に適用した結果、AUROCが同程度(約3%以内)でも「推論スコア」には相対で約25%の差が見られ、精度だけでは因果推論の欠落を見逃し得ることが示された。
  • この差は、学習の違いおよび介入のランダムシードの違いでも安定しており、さらに2種類の摂動オペレータの下でも再現されるため、監査手法の頑健性が支持される。
  • 本研究は、分子モデリングにおける科学的機械学習では、構造的な因果監査を従来の精度評価の補完として用いるべきだと提案している。

要旨: 薬物—標的相互作用(DTI)予測のための深層学習モデルは、必ずしも機構的に意味のある分子特徴に依存しなくても、強いベンチマーク性能を達成することがしばしばあります。この制限は、標準的な精度ベースの評価では検出できません。私たちは、ISAAC(因果推論のための介入ベース構造監査アプローチ)を提案します。これは事後的(post-hoc)フレームワークであり、予測精度とは独立して、対応付けられた機構的入力レベルの介入と見かけ(spurious)入力レベルの介入によって凍結モデルをプロービングし、事前相対的な構造感度を評価します。Davisベンチマーク上の3つの配列ベースDTIアーキテクチャに適用したところ、ISAACは、AUROCが同程度(約3%以内)であるモデル間で推論スコアにおよそ25%の相対差があることを明らかにしました。これらの差異は、学習および介入のシードにわたって安定しており、さらに2種類の異なる摂動(perturbation)演算子でも同様に安定しています。従来の精度指標では検出できないこれらの不一致は、分子モデリングにおける科学的機械学習で、標準的な性能評価に加えて事後的な構造監査を用いることを動機づけるものです。