SGA-MCTS:学習不要の原子的経験リトリーバルによる計画と実行の分離
arXiv cs.AI / 2026/4/17
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- SGA-MCTSは、LLMの複雑な多段計画を非パラメトリックなリトリーバル問題として捉え直すことで、推論時探索の高遅延と教師あり微調整による汎化の限界というトレードオフを回避する。
- オフラインではMonte Carlo Tree Search(MCTS)で解空間を探索し、高忠実な軌跡をState-Goal-Action(SGA)アトムへ蒸留し、具体的な対象を象徴的なスロットとして抽象化する。
- 推論時には、ハイブリッドの記号・セマンティック機構を用いた検索強化エージェントが関連するSGAを取得し、現在の文脈へ再グラウンディングして「ソフトな推論ヒント」として与える。
- 複雑なベンチマークで、SGA-MCTSを用いた凍結済みのオープンウェイトモデルがタスク特化の微調整なしでSOTA(例:GPT-5)級の性能に到達すると報告されている。
- 高コストな探索をオフラインで償却することで、「System 2」的な推論の深さを「System 1」的な推論速度で実現し、リアルタイムな自律計画をよりスケーラブルにすることを目指している。



