Reasoning Graphs:エビデンス中心のチェーン・オブ・ソートフィードバックにより決定論的エージェントの精度を高める

arXiv cs.CL / 2026/4/10

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、エージェントの「チェーン・オブ・ソート」が類似したクエリ間でリセットされるため、先行する熟慮が破棄されてしまい、精度が低下するとともに実行間(run-to-run)のばらつきが大きくなると主張している。
  • それに対して、推論グラフ(reasoning graphs)を提案し、取得された特定のエビデンスに結び付いた熟慮を永続化する。具体的には、後続の実行で辿れるように、エビデンスに接続された構造化エッジを保存する。
  • さらに、エビデンスに基づく後方へのトラバース(backward traversal)を、クエリの類似性や直近性(recency)によって検索する従来のメモリ手法と対比し、フィードバックは「クエリ」ではなく「現在評価しているエビデンス」に紐づく点を強調する。
  • また、候補集合をパイプラインプランナーによって反復的に絞り込むためのリトリーバルグラフ(retrieval graphs)も提案し、これらのグラフを組み合わせることで、再学習(retraining)なしで精度を向上させつつばらつきを縮小する自己改善ループが形成されると主張している。
  • 著者らは構造とトラバースアルゴリズムを形式化し、多ホップ質問応答ベンチマークにおける精度収束を測定するための評価プロトコル(逐次クラスタ評価)を提示する。

Reasoning Graphs:エビデンス中心のチェーン・オブ・ソートフィードバックにより決定論的エージェントの精度を高める | AI Navigate