VPS：自然言語の「批判」だけで推論を拡張する第4の軸

Zenn / 4/28/2026

💬 OpinionIdeas & Deep AnalysisModels & Research

共有:

Key Points

VPSは、自然言語中の「批判（critique）」だけを手がかりに推論プロセスを拡張できる“第4の軸”として提案している。
批判を入力として扱うことで、従来とは異なる形の推論拡張（エラー検出・反証・改善の方向づけ）を目指している。
文章生成や推論で「良し悪しの判断」を批判の形で与えることで、モデルが自己修正や再検討を行いやすくなる設計思想が示されている。
VPSは、単なるプロンプトの言い換えではなく、推論を伸ばすための入力モダリティ／信号設計の枠組みとして位置づけられている。

TL;DR 推論時スケーリングの第4の軸「外部言語監督の粒度」を提唱。訓練不要で推論性能を引き上げる VPS（Verbal Process Supervision）は、強い監督モデルのステップ単位言語批判で、弱いActorの推論軌跡を反復改善する GPQA Diamondで94.9%（既存SOTA 94.1%を無勾配更新で超過） AIME 2025では弱Actorのスコアを26.7%から**90.0%**へ+63.3pp救助（最大効果） Reflexionより+8.5〜+12.1pp優位。監督者マージンと性能の相関はr = +0.90 なぜ重要か LLMの推論能力を引き...

Continue reading this article on the original site.

Read original →