同次ニューラルネットワークによる相関のある離散選択モデルのための償却推論（Amortized Inference）

arXiv cs.LG / 2026/3/27

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、標準的なロジット離散選択モデルの限界に対処するため、一般的で、かつ（場合によっては）相関をもつ誤差分布に対しても選択確率を近似できる償却型ニューラルネットワーク・エミュレータを導入する。
集団論（グループ論）的な不変性に基づく、特殊化された同次（equivariant）アーキテクチャを提案し、最小限の不変特徴量の集合を用いた普遍近似の結果を含む。
手法では、勾配整合ペナルティ付きのソボレフ訓練を用いることで、エミュレータが選択確率とその導関数の両方を学習し、より高速な尤度評価と勾配計算を可能にする。
著者らは、近似が穏やかな仮定の下で、エミュレータに基づく最大尤度推定量が整合的で漸近的に正規であること、さらに近似が不完全な場合でも妥当な「サンドイッチ」標準誤差が得られることを示す理論結果を提示する。
シミュレーション結果から、GHKシミュレータと比べて精度と速度が向上しており、複雑な代替（サブスティテューション）パターンを伴う離散選択設定での推定に実用上の利点があることが示唆される。

Abstract

離散選択モデルは、意思決定の理解および予測のために、管理科学・経済学・マーケティングにおける基本的な道具である。選好確率のための便利な閉形式表現により、ロジット（Logit）に基づくモデルが応用分野で主流である。しかし、これらのモデルは確率的効用成分に関する制約の強い仮定を伴い、そのため、現実的かつ理論的に根拠のある選択行動（とりわけ、代替パターン）を捉える能力が制限される。本研究では、相関のある誤差を含む一般の誤差分布に対して、選択確率を近似するためにニューラルネットワーク・エミュレータを用いる償却推論（amortized inference）アプローチを提案する。提案手法には、離散選択モデルの不変性（invariance）特性を尊重するよう設計された専用のニューラルネットワーク構造と、それに付随する学習手順が含まれる。我々は、最小限の不変特徴量の集合が与えられた場合に普遍近似が成り立つことを示す証明を含め、構造のための群論的（group-theoretic）基礎を提示する。学習後、エミュレータは高速な尤度評価と勾配計算を可能にする。我々はソボレフ学習（Sobolev training）を用い、尤度損失に勾配整合のペナルティを加えることで、エミュレータが選択確率とその導関数の両方を学習できるようにする。さらに、エミュレータに基づく最大尤度推定量は、穏やかな近似条件の下で、一貫性および漸近正規性をもつことを示し、不完全な尤度近似があっても妥当であり続けるサンドイッチ標準誤差を提示する。シミュレーションにより、GHKシミュレータに比べて精度と速度の両面で大きな改善が得られることを示す。