広告

タンパク質ネットワークのイベント埋め込み:生物学的機能の合成(コンポジショナル)学習

arXiv cs.LG / 2026/4/2

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、タンパク質間相互作用ネットワークに対して「厳密な合成(compositional)構造」をシーケンス埋め込みへ強制すると、意味ある幾何学的な配置が得られるかを検証している。
  • Event2Vec(加法的なシーケンス埋め込み)で、human STRING interactomeのランダムウォークから64次元表現を学習し、同一ウォークで訓練したDeepWalk(Word2Vecベース)と比較した。
  • 結果として、合成構造は経路のコヒーレンス、機能アナロジーの精度、階層的な経路の組織化を大きく改善した(例:経路コヒーレンス 30.2× vs 2.9×、類似度0.966 vs 0.650)。
  • 一方で、ノルムと次数の反相関などの幾何学的性質は、非合成ベースラインとも共有されるか、同等以上の性能が見られた。
  • 本研究は、合成性を強制することが、生物ネットワークにおける関係推論や合成的推論のタスクに特に有効であることを示唆している。

Abstract

本研究では、配列埋め込みにおいて厳密な構成的(compositional)構造を強制することが、タンパク質—タンパク質相互作用ネットワークに適用された際に意味のある幾何学的な編成をもたらすかどうかを検討する。加法的な配列埋め込みモデルであるEvent2Vecを用いて、ヒトのSTRING相互作用地図からのランダムウォークに基づき64次元の表現を学習し、同じウォークに基づいてWord2Vecにより学習したDeepWalkのベースラインと比較する。その結果、構成的構造は、経路コヒーレンスを大幅に改善する(ランダム上で30.2 imes vs 2.9 imes)、機能アナロジーの精度を改善する(平均類似度0.966 vs 0.650)、および階層的な経路の編成を改善することが分かった。一方で、ノルム—次数の反相関のような幾何学的性質は、非構成的ベースラインと同等に共有されるか、あるいはそれを上回る。これらの結果は、強制された構成性が、生物学的ネットワークにおける関係的・構成的な推論タスクに対して特に有益であることを示している。

広告