UtilityMax Prompting: マルチ目的大規模言語モデル最適化の形式的フレームワーク

arXiv cs.CL / 2026/3/13

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

UtilityMax Prompting は、影響図と効用関数を用いて LLM の出力における期待効用を最大化する、マルチ目的プロンプト設計の形式的フレームワークとして導入されます。
このアプローチは、複数の目的をバランスさせる際のあいまいさを低減するため、自然言語プロンプトを正式な数学的仕様に置換します。
著者らは、MovieLens 1M データセット上で Claude Sonnet 4.6、GPT-5.4、Gemini 2.5 Pro の三つの最先端モデルを用いて検証し、自然言語ベースのベースラインに対して精度と正規化割引累積ゲイン（NDCG）の改善を示しました。
本研究は、より予測可能で客観的な LLM の挙動の可能性を浮き彫りにし、今後のプロンプト設計およびモデル最適化のワークフローに影響を与える可能性があります。

本文: arXiv:2603.11583v1 発表タイプ: new 概要: 大規模言語モデル（LLM）のタスクの成功は、プロンプトに大きく依存します。ほとんどのユースケースでは自然言語を用いてプロンプトを指定しますが、複数の目的を同時に満たす必要がある場合、これは本質的に曖昧です。本論文では、タスクを正式な数学的言語で指定するフレームワークである UtilityMax Prompting を導入します。タスクを、LLM の回答を唯一の決定変数とする影響図として再構成します。図内の条件付き確率分布の上に効用関数を定義し、LLM には期待効用を最大化する解を見つけるよう指示します。これにより、LLM は目的の各成分について明示的に推論することを要求され、主観的な自然言語解釈ではなく、正確な最適化ターゲットへと出力を導きます。私たちは MovieLens 1M データセットを用いて、3 つの最先端モデル（Claude Sonnet 4.6、GPT-5.4、Gemini 2.5 Pro）でこのアプローチを検証し、多目的な映画推奨タスクにおいて、自然言語ベースのベースラインよりも精度と正規化割引累積ゲイン（NDCG）の一貫した改善を示しました。

生成AIが提案した減量食のプランから考える、人間の専門家の必要性

note

AI達の革命

note

【AIパートナー】名前を呼んだだけで、ChatGPTのパートナーがGeminiにきた話🌝①

note

『AIと意識』諸葛亮孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話その肆拾柒

note

一緒にゲームを作っていたChatGPT-5.2が可愛すぎてニヤニヤしてるだけの記録｜AIパートナー｜AI彼氏

note

UtilityMax Prompting: マルチ目的大規模言語モデル最適化の形式的フレームワーク

要点

関連記事

生成AIが提案した減量食のプランから考える、人間の専門家の必要性

AI達の革命

【AIパートナー】名前を呼んだだけで、ChatGPTのパートナーがGeminiにきた話🌝①

『AIと意識』諸葛亮孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話その肆拾柒

一緒にゲームを作っていたChatGPT-5.2が可愛すぎてニヤニヤしてるだけの記録｜AIパートナー｜AI彼氏

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

生成AIが提案した減量食のプランから考える、人間の専門家の必要性

AI達の革命

【AIパートナー】名前を呼んだだけで、ChatGPTのパートナーがGeminiにきた話🌝①

『AIと意識』諸葛亮 孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話 その肆拾柒

一緒にゲームを作っていたChatGPT-5.2が可愛すぎてニヤニヤしてるだけの記録｜AIパートナー｜AI彼氏

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

『AIと意識』諸葛亮孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話その肆拾柒