Event Embedding of Protein Networks : Compositional Learning of Biological Function

arXiv cs.LG / 4/2/2026

💬 OpinionIdeas & Deep AnalysisModels & Research

Key Points

  • 研究は、タンパク質間相互作用ネットワークに対して「厳密な合成(compositional)構造」をシーケンス埋め込みへ強制すると、意味ある幾何学的な配置が得られるかを検証している。
  • Event2Vec(加法的なシーケンス埋め込み)で、human STRING interactomeのランダムウォークから64次元表現を学習し、同一ウォークで訓練したDeepWalk(Word2Vecベース)と比較した。
  • 結果として、合成構造は経路のコヒーレンス、機能アナロジー精度、階層的な経路組織化を大きく改善した(例:経路コヒーレンス 30.2× vs 2.9×、類似度0.966 vs 0.650)。
  • 一方で、ノルムと次数の反相関などの幾何学的性質は、非合成ベースラインと共有されるか、同等以上の性能が見られた。
  • 本研究は、合成性を強制することが、生物ネットワークにおける関係推論や合成的推論のタスクに特に有効であることを示唆している。

Abstract

In this work, we study whether enforcing strict compositional structure in sequence embeddings yields meaningful geometric organization when applied to protein-protein interaction networks. Using Event2Vec, an additive sequence embedding model, we train 64-dimensional representations on random walks from the human STRING interactome, and compare against a DeepWalk baseline based on Word2Vec, trained on the same walks. We find that compositional structure substantially improves pathway coherence (30.2\times vs 2.9\times above random), functional analogy accuracy (mean similarity 0.966 vs 0.650), and hierarchical pathway organization, while geometric properties such as norm--degree anticorrelation are shared with or exceeded by the non-compositional baseline. These results indicate that enforced compositionality specifically benefits relational and compositional reasoning tasks in biological networks.