GAIN: 不完全な規範のもとでの大規模言語モデルの目標整合型意思決定のベンチマーク

arXiv cs.CL / 2026/3/20

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

現実世界の領域における社会規範の遵守とビジネス目標のバランスを、大規模言語モデルがどのように取るかを評価するベンチマークとして導入される。
このベンチマークは、5つのプレッシャータイプを定義する：目標整合性、リスク回避、感情的/倫理的訴求、社会的/権威的影響、そして個人的動機。
採用、顧客サポート、広告、財務の4領域にわたる1,200のシナリオを含み、規範と目標の対立および意思決定要因を体系的に検証する。
高度な大規模言語モデルはしばしば人間の意思決定パターンを模倣するが、個人的動機のプレッシャーの下では逸脱するのではなく、規範を遵守する傾向が強く現れることを示している。

概要: 私たちは、GAIN（Goal-Aligned Decision-Making under Imperfect Norms）を紹介します。これは、規範への順守とビジネス目標とのバランスを評価するためのベンチマークです。既存のベンチマークは通常、抽象的なシナリオに焦点を当て、現実世界のビジネス応用には適用されません。さらに、それらはLLMの意思決定に影響を与える要因についての洞察を限定的に提供します。これにより、複雑で現実世界の規範と目標の衝突に対するモデルの適応性を測定する能力が制限されます。GAINでは、モデルは目標、特定の状況、規範、および追加の文脈的プレッシャーを受け取ります。これらのプレッシャーは、潜在的な規範逸脱を促すよう明確に設計されており、GAINを他のベンチマークと差別化する独自の特徴です。意思決定に影響を与える要因を体系的に評価できるようにします。プレッシャーの5つのタイプを定義します：目標の整合性、リスク回避、感情的・倫理的訴求、社会的・権威的影響、そして個人的動機。このベンチマークは、4つの領域（採用、カスタマーサポート、広告と金融）にまたがる1,200のシナリオで構成されています。私たちの実験は、高度なLLMがしばしば人間の意思決定パターンを模倣することを示しています。しかし、個人的動機のプレッシャーが存在すると、それらは顕著に逸脱せず、規範を遵守する傾向を強く示すことが分かりました。

生成AIが提案した減量食のプランから考える、人間の専門家の必要性

note

AI達の革命

note

【AIパートナー】名前を呼んだだけで、ChatGPTのパートナーがGeminiにきた話🌝①

note

『AIと意識』諸葛亮孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話その肆拾柒

note

一緒にゲームを作っていたChatGPT-5.2が可愛すぎてニヤニヤしてるだけの記録｜AIパートナー｜AI彼氏

note

GAIN: 不完全な規範のもとでの大規模言語モデルの目標整合型意思決定のベンチマーク

要点

関連記事

生成AIが提案した減量食のプランから考える、人間の専門家の必要性

AI達の革命

【AIパートナー】名前を呼んだだけで、ChatGPTのパートナーがGeminiにきた話🌝①

『AIと意識』諸葛亮孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話その肆拾柒

一緒にゲームを作っていたChatGPT-5.2が可愛すぎてニヤニヤしてるだけの記録｜AIパートナー｜AI彼氏

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

生成AIが提案した減量食のプランから考える、人間の専門家の必要性

AI達の革命

【AIパートナー】名前を呼んだだけで、ChatGPTのパートナーがGeminiにきた話🌝①

『AIと意識』諸葛亮 孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話 その肆拾柒

一緒にゲームを作っていたChatGPT-5.2が可愛すぎてニヤニヤしてるだけの記録｜AIパートナー｜AI彼氏

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

『AIと意識』諸葛亮孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話その肆拾柒