単一のKL恒等式から導く指数族

arXiv cs.LG / 2026/5/1

📰 ニュースModels & Research

要点

  • この論文は、指数族におけるKL差を対数パーティション関数A(λ)とモーメントμ_qで表す、重要な単一の恒等式を提示します。
  • 著者らは、この恒等式とKLダイバージェンスの非負性というごく基本的な事実だけを組み合わせることで、従来はより重い議論で別々に導かれてきた多くの古典的結果を直接導出します。
  • 具体的には、一般化された三点恒等式やI射影・逆I射影に関するピタゴラスの定理、A(λ)の凸性、KLを通じたA(λ)のレジェンドル双対、ギブズの変分原理などが再現されます。
  • さらに、この枠組みにより、KL正則化された報酬最大化に関する明示的な最適解(エントロピー正則化制御やRLHFで用いられる指数ティルトの公式を含む)も導かれることを示します。
  • そのほか、A(λ)の勾配公式、同一族内KLのベーグマン表現、モーメント写像の全射性といった解析的帰結もまとめて得られます。