OTSS:文脈に応じた意思決定の重み学習のための出力ターゲット付きソフトセグメンテーション
arXiv cs.LG / 2026/5/4
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文は、最適化器向けの重みベクトル w(x) を、直接の方策や汎用的な予測スコアではなく、解釈可能な意思決定因子 z(x,d) 上で学習する「文脈に応じた意思決定重み学習」を扱います。
- 提案手法OTSS(Output-Targeted Soft Segmentation)は、意思決定因子に対してパーソナライズされた意思決定用の重みを出力するモデルで、ハード分割とソフト分割の違いに関する理論を示します。
- 理論的には、分割の重なりがある場合にハード分割が近似と推定のトレードオフで不利になり得る一方、実現可能な固定Kのソフトクラスは近似の下限を回避でき、パラメトリックな学習率を達成すると述べています。
- 真の重みと下流の後悔(regret)を厳密に計算できる統制ベンチマークでは、OTSSが比較手法に対して平均regretが最小となり、係数回復ではEMと同等でありながら約2桁の高速化を示します。
- マッチしたK=5の設定や実データの小売「Complete Journey」アンカー課題でもOTSSは競争力を保ち、報告された実験では平均regretの点推定で最良の結果を得ています。



