プロトコルのような通信レイヤとしての構造化インテント：クロスモデルの頑健性、フレームワーク比較、および弱モデル補償効果

arXiv cs.AI / 2026/4/1

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、構造化インテント表現（とりわけ5W3HベースのPPS）が、異なるAIモデル、言語、およびプロンプト枠組みをまたいでユーザーの目標をどのように維持するかを評価し、先行するPPSの結果を中国語だけでなく英語および日本語へと拡張する。

Abstract

構造化された意図表現は、異なるAIモデル、言語、プロンプトの枠組みをまたいで、ユーザーの目標をどれほど確実に保持できるのでしょうか。先行研究では、5W3Hベースの構造化された意図フレームワークであるPPS（Prompt Protocol Specification）が、中国語における目標整合性を改善し、英語および日本語にも一般化できることが示されました。本論文は、この問いを3つの方向に拡張します。すなわち、Claude、GPT-4o、Gemini 2.5 Pro間におけるクロスモデルの頑健性、CO-STARおよびRISENとの統制された比較、そして生態学的に妥当な状況におけるAI支援による意図拡張のユーザー研究（N=50）です。独立した判定者（DeepSeek-V3）によって評価された3,240件のモデル出力（3言語×6条件×3モデル×3領域×20タスク）の結果、構造化されたプロンプトは、非構造化のベースラインに比べて、言語をまたいだスコアのばらつきを大幅に低減することが分かりました。最も強力な構造化条件では、クロス言語のシグマ（sigma）が0.470から約0.020まで低下します。さらに、弱いモデルを補うような補償パターンも観察されます。最低ベースラインのモデル（Gemini）は、最も強いモデル（Claude, +0.217）よりもはるかに大きいD-Aの伸び（+1.006）を示します。現在の評価分解能のもとでは、5W3H、CO-STAR、RISENはいずれも同様に高い目標整合性スコアを達成しており、次元分解そのものが重要な能動的要因であることを示唆します。ユーザー研究では、AIによって拡張された5W3Hプロンプトによりインタラクションのラウンド数が60%減少し、ユーザー満足度が3.16から4.04へ向上しました。これらの知見は、構造化された意図表現が、人間とAIの相互作用における頑健なプロトコルのようなコミュニケーション層として実用的な価値を持つことを支持しています。