対数尤度ベクトルを用いたプロンプト-レスポンス分布の言語モデルマップ

arXiv cs.CL / 2026/3/20

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、条件付き分布を比較するために、プロンプトとレスポンスのペアに対する対数尤度ベクトルで言語モデルを表現する方法を提案する。
この空間におけるモデル間の距離は、対応する条件付き分布間のKLダイバージェンスを近似することを示している。
公開されている大規模な言語モデルの多様なコレクションを対象とした実験は、マップが意味のあるグローバルな構造を示し、モデル属性およびタスク性能と関連していることを実証している。
この手法は、プロンプトの変更によって生じる系統的なシフトを捕捉し、近似的な加法的組成性を示し、複合プロンプトの効果を予測可能にする。
PMI ベクトルを導入して無条件分布の影響を低減し、時には訓練データの差異をよりよく反映し、入力依存的なモデル挙動の分析を援助する。

概要：私たちは、プロンプトとレスポンスのペアに対する対数尤度ベクトルによって言語モデルを表現し、それらの条件付き分布を比較するためのモデルマップを構築する方法を提案します。この空間において、モデル間の距離は対応する条件付き分布間のKL発散を近似します。公開されている大規模な言語モデルのコレクションを対象とした実験は、マップがモデル属性やタスク性能との関係を含む意味のあるグローバルな構造を捉えることを示しています。この手法は、プロンプトの変更によって生じる体系的なシフトと、それらの近似的な加法的組成性を捉えることも示唆しており、複合プロンプト操作の効果を分析・予測する方法を示唆します。また、非条件付き分布の影響を減らすために点ごとの相互情報量（PMI）ベクトルを導入します。場合によっては、PMIベースのモデルマップが訓練データに関連する差をよりよく反映します。全体として、このフレームワークは入力に依存するモデル挙動の分析を支援します。

Day 10: 230回の奮闘セッション、結局は一人の人間が文書を読むことに尽きる

Dev.to

本番環境で壊れる、バイラルなAIコーディングデモの背後に潜む5つの危険な嘘

Dev.to

二つのボット、混乱したサーバー: NimbusがAIエージェントのアイデンティティについて明らかにしたこと

Dev.to

OpenTelemetryがLLMトレーシングを標準化しました。コード上では実際にはこのようになっています。

Dev.to

PIXIU: 金融分野向けの大規模言語モデル、指示データ、および評価ベンチマーク

Dev.to

対数尤度ベクトルを用いたプロンプト-レスポンス分布の言語モデルマップ

要点

関連記事

Day 10: 230回の奮闘セッション、結局は一人の人間が文書を読むことに尽きる

本番環境で壊れる、バイラルなAIコーディングデモの背後に潜む5つの危険な嘘

二つのボット、混乱したサーバー: NimbusがAIエージェントのアイデンティティについて明らかにしたこと

OpenTelemetryがLLMトレーシングを標準化しました。コード上では実際にはこのようになっています。

PIXIU: 金融分野向けの大規模言語モデル、指示データ、および評価ベンチマーク

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer