CascadeDebate: コストに配慮したLLMカスケードのためのマルチエージェント熟議

arXiv cs.CL / 2026/4/15

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • CascadeDebateは、曖昧なクエリや各段の意思決定境界における自信不足が原因で起きる不必要な早期エスカレーションを抑える、コストに配慮したLLMカスケードの枠組みを提案する。
  • 信頼度ベースのルータが不確実性を検知した場合にのみマルチエージェント熟議を挿入し、軽量なエージェントのアンサンブルで曖昧さを解消してから、より高コストなモデルへのアップグレードや専門家への引き渡しを行う。
  • アーキテクチャは、単一モデルでの推論と、モデル規模に応じた選択的なマルチエージェント熟議を切り替えることで、テスト時計算量(test-time compute)を動的に変化させる。
  • 科学、医学、一般知識の5つのベンチマークに対する実験で、強力な単一モデルのカスケードやスタンドアロンのマルチエージェントシステムに比べて最大26.75%の改善を示す。
  • オンライン閾値オプティマイザが堅牢な性能にとって重要であることが強調されており、固定されたエスカレーション方針に対して大きな利得(相対改善20.98%〜52.33%)をもたらし、現実のクエリ分布により適応する。