Reasoning Graphs：エビデンス中心のチェーン・オブ・ソートフィードバックにより決定論的エージェントの精度を高める

arXiv cs.CL / 2026/4/10

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

原文を読む →

共有:

要点

本論文は、エージェントの「チェーン・オブ・ソート」が類似したクエリ間でリセットされるため、先行する熟慮が破棄されてしまい、精度が低下するとともに実行間（run-to-run）のばらつきが大きくなると主張している。
それに対して、推論グラフ（reasoning graphs）を提案し、取得された特定のエビデンスに結び付いた熟慮を永続化する。具体的には、後続の実行で辿れるように、エビデンスに接続された構造化エッジを保存する。
さらに、エビデンスに基づく後方へのトラバース（backward traversal）を、クエリの類似性や直近性（recency）によって検索する従来のメモリ手法と対比し、フィードバックは「クエリ」ではなく「現在評価しているエビデンス」に紐づく点を強調する。
また、候補集合をパイプラインプランナーによって反復的に絞り込むためのリトリーバルグラフ（retrieval graphs）も提案し、これらのグラフを組み合わせることで、再学習（retraining）なしで精度を向上させつつばらつきを縮小する自己改善ループが形成されると主張している。
著者らは構造とトラバースアルゴリズムを形式化し、多ホップ質問応答ベンチマークにおける精度収束を測定するための評価プロトコル（逐次クラスタ評価）を提示する。