PROMPT2BOX:LLMプロンプト間の含意(エンテイルメント)構造を解明する
arXiv cs.CL / 2026/3/24
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、プロンプト分析にベクトル埋め込みを用いることの限界を指摘する。埋め込みは主に話題の類似性を反映するため、プロンプトの具体性(specifity)や難しさといった重要な差分を見落とす可能性がある。
- PROMPT2BOXは、学習済みエンコーダを用いてプロンプトを表現する「ボックス埋め込み」アプローチとして導入され、意味的な類似性と具体性(特異性)の関係の双方を保持する。
- 著者らは、既存データセットと合成データセットを組み合わせてエンコーダを訓練し、「より具体的である」などの例における具体性の順序付けを埋め込み空間に学習させる。
- ボックス埋め込みのための次元削減手法を開発し、可視化と、より信頼性の高いデータセット比較を可能にする。
- 実験により、PROMPT2BOXはベクトルベースラインよりもプロンプトの具体性の捉え方を改善することが示される。さらに、17のLLMにわたる階層クラスタリングでは、8.9%多く弱点(weakness)を検出し、階層の深さと指示文の具体性との相関が約33%強くなる。