Cognitive Loop of Thought:効率的な数学的推論のための可逆階層型マルコフ連鎖
arXiv cs.CL / 2026/4/9
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、大規模言語モデル(LLM)における長い連鎖的推論(chain-of-thought)を、より計算効率よく行うことを目的とした「Cognitive Loop of Thought(CLoT)」という可逆階層型マルコフ連鎖ベースの枠組みを提案する。
- CLoTは、階層的な下位問題分解、高い層ごとの後向き検証、そして高い層での検証後に冗長な低レベル手順を刈り込むことを組み合わせることで、従来のマルコフ/long-CoTアプローチの弱点に対処する。
- 枠組みの後向き推論と検証メカニズムを支えるため、新たな指示形式の後向き推論データセット「CLoT-Instruct」を提案する。
- 4つの数学ベンチマークでの実験により、頑健性の向上と誤り伝播の抑制が示される。GPT-4o-miniによるAddSubでの報告精度は99.0%であり、ベースラインのCoTバリアントをそれぞれ4.1%および2.9%上回った。
- 全体として本研究は、長いchain-of-thoughtによる推論の質を維持しつつ、広く普及を妨げる長系列長やKVキャッシュの非効率を削減することを目指している。



