Squeez:コーディングエージェント向けのタスク条件付きツール出力プルーニング

arXiv cs.AI / 2026/4/8

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 結果は、効率的でエビデンスに焦点を当てたコンテキスト選択によって、次のステップの意思決定に対する検索品質を損なうことなく、場合によっては向上させながら、コーディングエージェントの効率を改善できることを示唆しています。

Abstract

コーディングエージェントは、各観測のうち次のステップに必要なのはごく一部であるにもかかわらず、長いツール観測を繰り返し消費します。我々は、タスク条件付きツール出力プルーニングを研究します。すなわち、焦点を当てたクエリと1つのツール出力が与えられたとき、エージェントが次に検査すべき最小の逐語的なエビデンス・ブロックを返します。我々は、SWE-benchリポジトリのインタラクションから構築した11,477例と、合成のマルチエコシステム・ツール出力からなるベンチマークを導入し、さらに手作業でキュレーションされた618例のテストセットを用意しました。LoRAを用いてQwen 3.5 2Bを微調整し、より大きなゼロショット・モデルおよびヒューリスティックなプルーニングのベースラインと比較します。我々のモデルは、入力トークンの92%を削除しつつ、リコール0.86、F1 0.80を達成し、ゼロショットのQwen 3.5 35B A3Bに対してリコールを11ポイント上回り、さらにすべてのヒューリスティック・ベースラインを大きく上回ります。