UtilityMax Prompting: マルチ目的大規模言語モデル最適化の形式的フレームワーク
arXiv cs.CL / 2026/3/13
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- UtilityMax Prompting は、影響図と効用関数を用いて LLM の出力における期待効用を最大化する、マルチ目的プロンプト設計の形式的フレームワークとして導入されます。
- このアプローチは、複数の目的をバランスさせる際のあいまいさを低減するため、自然言語プロンプトを正式な数学的仕様に置換します。
- 著者らは、MovieLens 1M データセット上で Claude Sonnet 4.6、GPT-5.4、Gemini 2.5 Pro の三つの最先端モデルを用いて検証し、自然言語ベースのベースラインに対して精度と正規化割引累積ゲイン(NDCG)の改善を示しました。
- 本研究は、より予測可能で客観的な LLM の挙動の可能性を浮き彫りにし、今後のプロンプト設計およびモデル最適化のワークフローに影響を与える可能性があります。
本文: arXiv:2603.11583v1 発表タイプ: new
概要: 大規模言語モデル(LLM)のタスクの成功は、プロンプトに大きく依存します。ほとんどのユースケースでは自然言語を用いてプロンプトを指定しますが、複数の目的を同時に満たす必要がある場合、これは本質的に曖昧です。本論文では、タスクを正式な数学的言語で指定するフレームワークである UtilityMax Prompting を導入します。タスクを、LLM の回答を唯一の決定変数とする影響図として再構成します。図内の条件付き確率分布の上に効用関数を定義し、LLM には期待効用を最大化する解を見つけるよう指示します。これにより、LLM は目的の各成分について明示的に推論することを要求され、主観的な自然言語解釈ではなく、正確な最適化ターゲットへと出力を導きます。私たちは MovieLens 1M データセットを用いて、3 つの最先端モデル(Claude Sonnet 4.6、GPT-5.4、Gemini 2.5 Pro)でこのアプローチを検証し、多目的な映画推奨タスクにおいて、自然言語ベースのベースラインよりも精度と正規化割引累積ゲイン(NDCG)の一貫した改善を示しました。




