広告

From Moments to Models: Graphon-Mixture Learning for Mixup and Contrastive Learning

arXiv stat.ML / 2026/4/1

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、グラフオンとグラフモーメント(モチーフ密度)からその構成要素を推定することで、現実世界のグラフを生成的グラフモデルの混合としてモデル化するための統一的枠組みを提示する。
  • 構造的に類似したグラフオンから生成されたグラフは、高い確率でモチーフ密度が互いに類似する、という理論的保証を導入し、それに基づくグラフオン・ミクスチャ推定を支える。
  • 推定された生成的混合の構成要素に条件付けすることで、2つの下流パラダイムが改善されることを示す。具体的には、拡張のためのグラフオン・ミクスチャ対応mixup(GMAM)と、モデル認識型グラフコントラスト学習(MGCL)である。
  • シミュレーションおよび実データセットでの実験により、GMAMは7データセット中6データセットで新たな最先端の教師あり精度を達成し、MGCLは教師なしベンチマークで競争力があり、平均では最上位の順位となることを示す。

Abstract

実世界のグラフデータセットは、多くの場合、複数の母集団の混合として生じます。そこでは、グラフは複数の異なる基となる分布によって生成されます。本研究では、グラフデータをグラフォンで表される確率的なグラフ生成モデルの混合として明示的にモデル化する統一的な枠組みを提案します。これらのグラフォンを特徴付け、推定するために、同一の基となるモデルから生成されたグラフをクラスタリングする際、グラフモーメント(モチーフ密度)を活用します。さらに、構造的に類似したグラフォンからサンプリングされたグラフは、モチーフ密度が高い確率で類似することを示す、より厳密な上界を導出する新しい理論的保証を確立します。この結果により、グラフォン混合の成分を原理に基づいて推定できるようになります。推定されたグラフォン混合成分を取り込むことで、広く用いられている2つの下流パラダイム、すなわちmixupによるグラフデータ拡張と、グラフ対照学習を改善できることを示します。基となる生成モデルに応じてこれらの手法を条件付けることで、グラフォン混合に配慮したmixup(GMAM)と、モデルに配慮したグラフ対照学習(MGCL)を開発します。シミュレーションおよび実世界のデータセットの両方に対する大規模な実験により、強い実証的性能が示されます。教師あり学習では、GMAMは既存の拡張戦略を上回り、7つのデータセット中6つで新たな最先端の精度を達成します。教師なし学習では、MGCLは7つのベンチマークデータセット全体で競争力のある性能を示し、総合平均順位において最も低い順位を達成します。

広告