| こんにちは、Katanemo Labs(DigitalOceanの企業)のサルマン、シュグアン、アディルです。 エージェント型システムと呼ばれる最新の研究である「Signals」を紹介したいと思います。もしエージェントを作っているなら、エージェントのトレース/軌跡があまりにも多くて、1つずつレビューするのは大変だと気づいているはずです。また、すべてを検査するために人手や追加のLLM呼び出しを使うと、費用がすぐにかさんでしまいます。この論文では、エージェントのオンライン挙動を変更せずに、ライブなエージェント相互作用から軽量に構造化された「signals(シグナル)」を計算し、見てみる価値の最も高い軌跡を見つけ出せるようにする方法を提案しています。Signalsの計算にはGPUは不要です。 Signalsは、相互作用、実行、環境パターンにまたがるシンプルな分類(タクソノミー)の形でグループ化されます。たとえばミスアラインメント、停滞(stagnation)、離脱(disengagement)、失敗(failure)、ループ(looping)、疲弊(exhaustion)などです。τ-benchにおける注釈研究では、signalベースのサンプリングがランダムサンプリングに対して82%の情報性率を達成し、ランダムの54%を上回りました。これにより、有益な軌跡あたりで1.52倍の効率向上が得られました。 論文:arXiv 2604.00356。 https://arxiv.org/abs/2604.00356 分類(タクソノミー)、実装の詳細、またはどこでうまくいかなくなるかについての質問には喜んでお答えします。 [link] [comments] |
Signals – LLM判定者なしで最も有益なエージェントの痕跡を見つける(arxiv.org)
Reddit r/LocalLLaMA / 2026/4/5
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- Katanemo Labs(DigitalOceanの子会社)が、「Signals」という手法を紹介。エージェント同士のやり取りから構造化された指標を自動抽出し、レビューすべき最も有益なエージェントの痕跡に優先順位を付ける。
- このアプローチは、ライブの軌跡から「signals(指標)」を直接計算することで、LLM判定者や追加のコストがかかる検査ステップを回避する。さらにGPUは不要だと主張する。
- Signalsは、相互作用・実行・環境パターンにまたがるタクソノミとして整理され、ミスアライメント、停滞、離脱、失敗、ループ、疲弊などの問題を扱う。
- τ-benchにおける注釈研究では、signalベースのサンプリングが、ランダムサンプリングの54%に対して82%の有益性を達成し、有益な1つの軌跡あたりで1.52×の効率向上につながった。
- この取り組みには、参照されたGitHubプロジェクトとして公開実装が含まれており、実務者がエージェントの痕跡ワークフローに対して信号抽出を適用できるようになっている。




