エージェント型タスク性能を高めるためのサプリメント生成トレーニング

arXiv cs.LG / 2026/4/23

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 大規模基盤モデルをエージェント型タスクで学習させることは、高い計算コスト、長い反復サイクル、そして新モデルの登場による陳腐化の速さによって非現実的になりつつあります。
  • 提案手法であるSupplement Generation Training(SGT)は、小型のLLMにより有用な補助テキストを生成させ、それを元の入力に追記することで大規模LLMのタスク遂行を改善することを狙います。
  • SGTでは、補助文をタスク要件に応じて動的に適応させつつ、基盤となる大規模モデル自体は変更(微調整)しない方針です。
  • タスク固有の最適化を大規模基盤モデルから切り離すことで、現実のアプリケーションにおけるLLMエージェントの展開をより柔軟かつ低コストにすることを目指しています。