広告

SEAR: LLMゲートウェイのためのスキーマベース評価とルーティング

arXiv cs.AI / 2026/3/31

💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

要点

  • SEARは、複数モデル・複数プロバイダのLLMゲートウェイ向けに設計された、スキーマベースの評価およびルーティングシステムであり、本番の意思決定に向けてきめ細かな品質シグナルを改善することを目的としています。
  • LLM評価シグナル(例:コンテキスト/意図/応答の特性、品質スコア、問題の帰属)と、ゲートウェイの運用メトリクス(レイテンシ、コスト、スループット)を、一貫したテーブル間リンクによって結び付ける、拡張可能なリレーショナルスキーマを導入します。
  • SEARは、浅い分類器に依存するのではなく、スキーマ内に自己完結的なシグナル指示を埋め込み、複数段階の生成を行うことで、データベース投入に適した構造化出力を生成することを提案します。
  • LLMの推論によってシグナルを導出することで、SEARはより複雑な要求のセマンティクスを捉え、人が解釈できるルーティングの説明を提供します。
  • 数千件の本番セッションに対する実験では、人手ラベルデータに対して高いシグナル精度が示され、また、同等の品質を維持しつつコストを削減し得るルーティング結果が得られました。

要旨: LLMゲートウェイにおいて、プロダクション環境でのLLM応答の評価や、プロバイダ間でのルーティング要求の処理を行うには、きめ細かな品質シグナルと、運用に根ざした意思決定が必要です。このギャップに対処するため、我々はマルチモデル・マルチプロバイダのLLMゲートウェイ向けの、スキーマベースの評価およびルーティングシステムであるSEARを提示します。SEARは、LLM評価シグナル(コンテキスト、意図、応答特性、問題の帰属、品質スコア)と、ゲートウェイの運用メトリクス(レイテンシ、コスト、スループット)を両方カバーする拡張可能なリレーショナルスキーマを定義します。また、約100の型付きカラム(SQLで問い合わせ可能)にわたって、テーブル間の整合性リンクを備えます。評価シグナルを確実に生成するために、SEARは、自己完結型のシグナル指示、スキーマ内での推論、そしてデータベース投入に適した構造化出力を生成するマルチステージ生成を提案します。シグナルは浅い分類器ではなくLLMの推論により導出されるため、SEARは複雑な要求のセマンティクスを捉え、人が解釈可能なルーティングの説明を可能にし、評価とルーティングを単一のクエリ層に統合します。数千件のプロダクションセッションにわたって、SEARは人手でラベル付けされたデータに対して高いシグナル精度を達成し、同等の品質を維持しつつ大幅なコスト削減を含む実用的なルーティング判断を支援します。

広告