Reasoning Graphs:エビデンス中心のチェーン・オブ・ソートフィードバックにより決定論的エージェントの精度を高める
arXiv cs.CL / 2026/4/10
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、エージェントの「チェーン・オブ・ソート」が類似したクエリ間でリセットされるため、先行する熟慮が破棄されてしまい、精度が低下するとともに実行間(run-to-run)のばらつきが大きくなると主張している。
- それに対して、推論グラフ(reasoning graphs)を提案し、取得された特定のエビデンスに結び付いた熟慮を永続化する。具体的には、後続の実行で辿れるように、エビデンスに接続された構造化エッジを保存する。
- さらに、エビデンスに基づく後方へのトラバース(backward traversal)を、クエリの類似性や直近性(recency)によって検索する従来のメモリ手法と対比し、フィードバックは「クエリ」ではなく「現在評価しているエビデンス」に紐づく点を強調する。
- また、候補集合をパイプラインプランナーによって反復的に絞り込むためのリトリーバルグラフ(retrieval graphs)も提案し、これらのグラフを組み合わせることで、再学習(retraining)なしで精度を向上させつつばらつきを縮小する自己改善ループが形成されると主張している。
- 著者らは構造とトラバースアルゴリズムを形式化し、多ホップ質問応答ベンチマークにおける精度収束を測定するための評価プロトコル(逐次クラスタ評価)を提示する。




