意図マッチングによるポリシー駆動型LLMルーティング:Instrument Laboratories向け

arXiv cs.AI / 2026/5/1

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • この論文は、LLMベースの工学系ラボ・チュータリングに対し、「十分な支援」と「学習機会の維持」のバランスを取るための、ポリシー駆動型のルーティングおよびガバナンス・システムを提案します。
  • システムは、複数のLLMバックエンドを管理し、プロンプト修正と利用ログを設定可能にするOpenAI互換ゲートウェイのRoutiiumと、埋め込みベースの意図/質問マッチングによりラボ予算や承認ワークフローを強制するポリシー対応ルーティングサービスのEduRouterの2部構成です。
  • 2つの工学系ラボ(LED特性評価、RC回路解析)に基づくトレース駆動のシミュレーションでは、ガバナンスされたポリシーが、ガバナンスなしの運用に比べて学習アラインメント指標を大きく改善したことが示されます。
  • 実モデルでの100クエリ再生では、EduRouterがクエリの75%をローカルモデルにルーティングし、トークンコストをプレミアムモデル一律ルーティングより66%削減した一方で、厳選した89意図の質問バンクに対するカノニカルヒット率は1.0を維持したと報告されています。
  • 著者らは、Routiium、EduRouter、カノニカータスク用ツール、シミュレータ設定を公開し、再現と今後の教室研究を支援します。

概要: 工学系ラボにおけるAIチュータリングシステムは、十分な支援を提供することと、学習の機会を損なわないようにすることの間に緊張関係があります。既存のシステムでは、通常、教員が支援のタイミング・内容・コストについて限られた制御しかできません。本論文では、LLMベースのラボ支援のためのルーティングおよびガバナンスシステムを、2つのコンポーネントから構成される形で説明します。RoutiiumはOpenAI互換のゲートウェイであり、複数のLLMバックエンドを、設定可能なプロンプト修正と利用ログ記録を備えて管理します。EduRouterは、ポリシーを意識したルーティングサービスで、ラボごとの予算、承認ワークフロー、埋め込みに基づく質問マッチングを強制します。本システムは、2つの工学ラボ(LED特性評価、RC回路解析)からキャリブレーションしたトレース駆動シミュレーション、およびライブモデルによる100クエリのリプレイを用いて評価しました。シミュレーションでは、ガバナンスされたポリシー(P1/P2)により、ガバナンスなしの運用(P0)と比較して、チャレンジ整合度指標が0.90から0.98へ、オーバーレイ遵守スコアが0.69から0.87へと向上しました。また、生産的な葛藤ウィンドウの指標は、高い足場(スキャフォールド)ヒントが現れる前の模擬ターン数として、1.4から3.6へ増加しました。100クエリのリプレイでは、EduRouterがクエリの75%をローカルモデルへルーティングし、トークンコストを66%削減しました(すべてプレミアムへのルーティングの場合は0.26に対して0.087)。さらに、キュレーションされた89件の意図(intent)質問バンクに対する代表的なヒット率(canonical hit rate)は1.0のまま維持されました。私たちは、Routiium、EduRouter、canonical-taskツール群、およびシミュレータ設定を公開し、複製および将来の教室における研究を支援します。