LLMの性能に対するプロンプト構成要素の影響を理解するための回帰フレームワーク
arXiv cs.LG / 2026/3/31
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、プロンプトの各セグメントを評価結果に結び付けることで、特定のプロンプト構成要素がLLMの性能にどのように影響するかを定量化する統計的回帰フレームワークを提案する。
- 先行研究のXAIスタイルの手法をLLMの検査に適応し、プロンプト部分への回帰を用いて性能のばらつきを説明する。
- 算術タスクに適用したところ、回帰モデルはMistral-7Bで性能のばらつきの72%、GPT-OSS-20Bで77%を説明できた。
- 著者らは、誤った例のクエリ—回答ペアとして現れる誤情報は、両モデルの算術クエリを解く能力を損なう一方で、正しい例は影響に有意なばらつきを示さないことを見出した。
- 正の指示と負の指示が性能に対して矛盾する効果を持ち得ることを報告しており、重要な導入においてはきめ細かなプロンプト監査の必要性が示唆される。



