STATe-of-Thoughts:ツリー・オブ・ソートのための構造化されたアクション・テンプレート
arXiv cs.CL / 2026/4/1
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- ツリー・オブ・ソート型の推論時コンピュート手法は、高温度サンプリングに大きく依存するため、有意義な多様性を生成できないことがあります。また、推論プロセスに対する制御も限定的です。
- 提案手法のSTATe Of Thoughts(STATe)は、確率的サンプリングを、コントローラ–ジェネレータ–エバリュエータの枠組みに置き換えます。ここでは、離散的で解釈可能なアクション・テンプレートを用いて、推論上の選択を導きます。
- STATeは、温度ベースのサンプリングよりも、構造化されたテキストによる介入を通じて、LLM生成へのより信頼性の高い影響と、より高い出力多様性を示します。
- 議論生成のケーススタディでは、STATeの明示的なアクション系列が、出力品質と強く予測的に結びつく解釈可能な特徴を特定します。
- アクション選択とパフォーマンスの関連を分析することで、STATeは推論/アクション空間の有望な領域を見つけ、生成をそこへ導くことで、制御可能性と解釈可能性を高められます。



