要旨: 自己回帰的なグラフ生成器は、逐次的な構築プロセスにより尤度を定義するが、これらの尤度が意味を持つのは、同じグラフのあらゆる線形化に対して一貫している場合のみである。最近の線形化手法である Segmented Eulerian Neighborhood Trails(SENT)は、グラフを、完全に復号でき、かつ言語モデルにより効率的に処理できる一連の系列へと変換するが、同じグラフの複数の同値な線形化を許容する。われわれは、同値な線形化間での変動係数を用いて、割り当てられた負の対数尤度(NLL)の違反を定量化し、これを Linearization Uncertainty(LU)と呼ぶ。4つの線形化戦略に基づいて2つのデータセットでトランスフォーマーを学習し、偏った順序付けが自分自身の順序ではより低いNLLを達成する一方で、ランダムな置換の下では予想される較正誤差(ECE)が2桁大きいことを示す。これは、これらのモデルが基盤となるグラフではなく、学習時の線形化を学習していることを示唆する。分子グラフのベンチマーク QM9 では、生成されたグラフのNLLは分子安定性と負の相関を示す(AUC =0.43)。一方で LU は AUC =0.85 を達成し、置換ベースの評価が生成分子の品質チェックとしてより信頼できることを示している。コードは https://github.com/lauritsf/linearization-uncertainty で利用可能である
同じグラフ、異なる尤度:置換同値なエンコーディングによる自己回帰型グラフ生成器のキャリブレーション
arXiv cs.LG / 2026/4/8
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 自己回帰型グラフ生成器の尤度は、同一グラフの異なる線形化に対して一貫性が保たれる場合に限り信頼でき、キャリブレーションに焦点を当てた評価が動機づけられる。
- 本論文では、置換同値なエンコーディング間での変動係数(coefficient of variation)を用いて、負の対数尤度の一貫性に対する違反を測定する指標として、線形化不確実性(Linearization Uncertainty: LU)を導入する。
- 4つの線形化戦略でトランスフォーマーモデルを学習する実験により、特定の順序に偏ったモデルは自らのネイティブな線形化ではNLLが低くなる一方、ランダムな置換ではキャリブレーションが劇的に悪化することが示される。
- QM9において、生成グラフのNLLは分子安定性と弱く相関するのに対し、LUははるかに強く相関し、分子生成の品質指標としてLUがより信頼できる可能性が示唆される。
- 本研究は、置換に基づく評価およびLUに基づくモデル評価を可能にするコードを、リンクされたリポジトリとして提供している。


