冷スタート状況におけるマルチレベルのタスクプロファイル誘導データ合成とタスク認識型LLMルーティング

arXiv cs.CL / 2026/4/13

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、特にコールドスタートのルーティングにおいて、インドメインデータが利用できない場合でも、テスト時のクエリ分布をより適切に近似する多様なQAペアを生成するための、マルチレベルのタスクプロファイル誘導データ合成手法を提案する。
懸念されるタスクタイプを考慮したLLMルーティング手法TRouterを導入し、潜在的なタスクタイプ変数を用いて、クエリ条件付きのコストと性能をモデル化する。
TRouterは、合成された階層的タスク分類法から導出した事前分布を活用し、インドメインの学習データが限定的、または欠如している状況下でのルーティング判断を正則化する。
複数のベンチマークでの実験により、合成フレームワークがコールドスタートの課題を低減し、TRouterがコールドスタート環境およびインドメイン環境の両方で実運用におけるLLMルーティング品質を改善することが示される。

要旨: 大規模言語モデル（LLM）は、タスクやクエリにまたがって、性能と計算コストのばらつきが大きいことが示されており、ユーザー固有のコストと性能のトレードオフを満たすためにモデルを選択するルーティングシステムが求められています。しかし、既存のルータは、ドメイン内の学習データが利用できないコールドスタート状況では十分に汎化できません。この制限に対し、階層的なタスク分類法を構築し、テスト時のクエリ分布を近似するために多様な質問—回答ペアを生成する、多段階のタスクプロフィール誘導データ合成フレームワークを提案します。さらにこれを基に、TRouter という、クエリ条件付きのコストと性能を潜在タスクタイプ変数でモデル化し、合成されたタスク分類法から導出した事前正則化を用いる、タスクタイプに着目したルータ手法を導入します。この設計により、TRouter のルーティング有用性はコールドスタート時とドメイン内設定の両方で向上します。複数のベンチマークにおいて、提案する合成フレームワークがコールドスタート問題を緩和し、TRouter が効果的な LLM ルーティングを実現することを示します。