Polaris：経験抽象化によるポリシー修復を通じて、小型言語モデルを対象とする「ゲーデル・エージェント」フレームワーク

arXiv cs.LG / 2026/3/25

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

Polarisは、「ゲーデル・エージェント」フレームワークとして提案されており、コンパクト（小型）言語モデルが、失敗を検査し、推論し、反復的に自分自身のポリシーを修復することで、再帰的なポリシー自己改善を行えるようにします。
この手法では「経験抽象化」を用いて、観測された失敗をコンパクトで再利用可能な戦略へと蒸留し、単に1つの応答だけを直すのではなく、未見の事例にもポリシー更新が転移するようにします。
Polarisは、構造化されたサイクル（分析、戦略形成、抽象化、そして最小限のコードパッチによる修復）によってポリシーレベルの変更を行い、更新を小さくしつつ監査可能性を保つために慎重なチェックを組み込みます。
フレームワークにはメタ推論が含まれており、エージェントが自らの誤りを説明し、具体的なポリシー修正案を提示し、その修正を反映することで、改良がベンチマーク全体にわたって持続し、累積していきます。
実験では、MGSM、DROP、GPQA、LitBenchを含むベンチマークにおいて、基準ポリシーと比較して、Polarisを用いた7Bモデルで一貫した向上が報告されています。