予測誤差を接空間へ射影することで実現する意思決定重視学習

arXiv cs.LG / 2026/5/5

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

この論文は、意思決定重視学習（DFL）における主要な課題として、後流の意思決定品質を直接高めるために必要なレグレット勾配の計算が、最適化ソルバの微分や代理損失への依存により難しく高コストになりがちである点を扱います。
標準的な正則性条件（局所的に安定したアクティブ制約）のもとで、レグレット勾配が幾何学的に閉形式で記述できることを導出し、それが「アクティブ制約の接空間への射影」された予測誤差に対応し、さらに局所的な曲率でスケールされることを示します。
この結果に基づき、PEAR（Projected Error As Regret-gradient）を提案し、アクティブ制約に限定した縮小線形システムを解くことでレグレット勾配を計算し、ソルバ反復の微分や追加の最適化を不要にします。
実験では、LPベンチマークと実世界のQPタスクにおいて、PEARがベースラインの中で最良の意思決定品質を達成しつつ、計算効率が最も高いことが示されます。
さらに、その優位性は制約が変化した場合でも維持されるため、アクティブ制約集合の変動に対して頑健である可能性が示唆されます。