LLMの自己修正はいつ役立つのか?制御理論的マルコフ診断と「検証優先」介入

arXiv cs.AI / 2026/4/27

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、LLMの反復的な自己修正をサイバネティクス的なフィードバックループとしてモデル化し、{Correct, Incorrect} の2状態マルコフ枠組みを用いて「反復する/やめる」を判断する診断を提示している。
  • ECR/EIRに基づく安定性条件(ECR/EIR > Acc/(1-Acc) のときのみ反復)を提案し、EIRを安定性マージン、プロンプトを軽量なコントローラ設計として解釈している。
  • 7モデル・3データセット(GSM8K、MATH、StrategyQA)での実験により、自己修正が有益か有害かを分ける「EIRのほぼゼロの閾値(≤0.5%)」が鋭く観測された。
  • 「検証優先」プロンプトのアブレーションにより、この閾値をプロンプトだけで跨げることの因果的証拠が示されており、GPT-4o-miniではEIRが2%から0%に低下し、劣化が改善に反転した。
  • 著者らは、自己修正をデフォルトのエージェント挙動ではなく、エラーダイナミクスに基づく制御判断として扱うべきだと主張している。

LLMの自己修正はいつ役立つのか?制御理論的マルコフ診断と「検証優先」介入 | AI Navigate