DAK-UCB: LLMおよび生成モデルのための多様性を考慮したプロンプトルーティング
arXiv cs.LG / 2026/3/25
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文では、忠実度と出力の多様性の両方を考慮しながら、利用可能な最良のLLMまたは生成モデルへプロンプトをルーティングするための文脈型バンディット手法「DAK-UCB」を提案する。
- 先行研究の選択手法が、プロンプトに基づく忠実度スコア(例:CLIP-Score)のみを最適化してしまうという制約に取り組み、多様性に関連する指標をモデル選択へ明示的に組み込むことでこれを改善する。
- DAK-UCBは、過去のラウンドにおけるプロンプト—出力ペアの2標本期待値から導出した、プロンプトに応じた多様性スコア関数を用いて、多様性を目標にしたオンライン選択を可能にする。
- 著者らは、多様性の測定指標として「結合カーネル距離」と「カーネルエントロピー」を用いることで、プロンプトの連続において忠実度を損なうことなく、多様性を考慮したモデル選択が改善されることを示す。
- 本研究はarXivで公開されており、付随するコードは公開GitHubリポジトリから提供される。
