概要:私たちは、プロンプトとレスポンスのペアに対する対数尤度ベクトルによって言語モデルを表現し、それらの条件付き分布を比較するためのモデルマップを構築する方法を提案します。この空間において、モデル間の距離は対応する条件付き分布間のKL発散を近似します。公開されている大規模な言語モデルのコレクションを対象とした実験は、マップがモデル属性やタスク性能との関係を含む意味のあるグローバルな構造を捉えることを示しています。この手法は、プロンプトの変更によって生じる体系的なシフトと、それらの近似的な加法的組成性を捉えることも示唆しており、複合プロンプト操作の効果を分析・予測する方法を示唆します。また、非条件付き分布の影響を減らすために点ごとの相互情報量(PMI)ベクトルを導入します。場合によっては、PMIベースのモデルマップが訓練データに関連する差をよりよく反映します。全体として、このフレームワークは入力に依存するモデル挙動の分析を支援します。
対数尤度ベクトルを用いたプロンプト-レスポンス分布の言語モデルマップ
arXiv cs.CL / 2026/3/20
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、条件付き分布を比較するために、プロンプトとレスポンスのペアに対する対数尤度ベクトルで言語モデルを表現する方法を提案する。
- この空間におけるモデル間の距離は、対応する条件付き分布間のKLダイバージェンスを近似することを示している。
- 公開されている大規模な言語モデルの多様なコレクションを対象とした実験は、マップが意味のあるグローバルな構造を示し、モデル属性およびタスク性能と関連していることを実証している。
- この手法は、プロンプトの変更によって生じる系統的なシフトを捕捉し、近似的な加法的組成性を示し、複合プロンプトの効果を予測可能にする。
- PMI ベクトルを導入して無条件分布の影響を低減し、時には訓練データの差異をよりよく反映し、入力依存的なモデル挙動の分析を援助する。

