構造化意図表現は汎化するのか? 5W3Hプロンプトによる言語横断・モデル横断の経験的研究
arXiv cs.AI / 2026/3/27
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本研究では、PPS(5W3Hベースの構造化意図表現フレームワーク)を評価し、それが言語およびLLMモデルをまたいで汎化するかどうかを検証する。
- 英語、日本語、(先行研究で扱われた)中国語を対象とし、複数のプロンプト条件、3つのLLMを用いて、合計2,160件のモデル出力を分析した結果、単純な入力からAIが自動生成した「拡張5W3Hプロンプト」は、言語をまたいでも有意な性能低下なく、目標整合性に関して手作業による5W3Hプロンプトと同等であることが示された。
- 論文では、構造化プロンプトがモデル間の出力分散を低減、または再構成しうることを報告しているが、その効果は言語および評価指標によって変動する。特に示唆が大きいのは、制約のないベースラインにおける「見かけ上の低分散(spurious low variance)」を補正することに関連している。
- さらに、非構造化プロンプトにおいて体系的な「二重インフレーションバイアス(dual-inflation bias)」が見いだされた。具体的には、複合スコアが不自然に高くなる一方で、モデル間分散が不自然に低く見える。
- 総合すると、構造化された5W3H表現は、非専門ユーザにとっての意図の整合性と利用可能性を改善することが示唆される。特に、AI支援による作成インタフェースと組み合わせた場合に効果が高い。



