CoT2-Meta:テスト時推論のための予算付きメタ認知制御
arXiv cs.AI / 2026/3/31
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- CoT2-Metaは、物体(オブジェクト)レベルのチェーン・オブ・ソート生成にメタ認知制御を追加する、学習不要のテスト時推論フレームワークである。
- 戦略条件付け生成と木構造の探索により導かれたメタコントローラが、「展開」「刈り込み」「修復」「停止」「フォールバック」のタイミングを決定する。
- オンラインのプロセス・オラクルが、ステップ単位の推論軌跡を評価することで、推論予算が固定された状況下でより的確に計算資源を割り当てられるようにする。
- 標準ベンチマーク(例:MATH、GPQA、GSM8K、BBEH、MMMU-Pro、HLE)において、CoT2-MetaはReST-MCTSを含む強力なベースラインを上回り、主要タスクでの向上幅は約+1.15〜+5.2ポイントと報告されている。
- 論文ではさらに、計算スケーリングの改善、キャリブレーション/選択的予測、ならびに15のより幅広いベンチマークと複数のバックボーン系にわたる一貫した有効性も報告している。



