AI Navigate

LLMベースの技術サービスエージェントの軽量適応: 潜在論理の拡張と頑健なノイズ低減

arXiv cs.LG / 2026/3/20

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • 効率性を高めつつ、潜在的な意思決定ダイナミクスと多様な妥当な応答に対処するための、LLMベースの技術サービスエージェント向けの軽量適応フレームワークを提案する。
  • 潜在論理拡張は、計画認識型軌道モデリングと意思決定推論の拡張を含み、監視付きファインチューニングを潜在的な意思決定プロセスとよりよく整合させ、安定性を高める。
  • ロバストノイズ低減は、二重フィルタリング手法によって意味論的多様性を捉えつつアノテーションノイズを低減する複数の正解データセットを構築する。
  • 軽量適応は、LLMベースのジャッジと軽量な関連性ベースの再ランク付け器を組み合わせるハイブリッド報酬機構を導入し、低いトレーニングコストで高品質な報酬を維持。実世界のクラウドサービスタスクで実証されている。