難易度を考慮したルーティングと不確実性に導かれた統合による適応的マルチ専門家推論
arXiv cs.CL / 2026/4/14
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、数学問題を予測される難易度と不確実性に基づいて動的に選択された戦略へルーティングする、適応的マルチ専門家推論(AMR)を提案する。
- AMRは「俊敏なルーティング」コンポーネントに加え、生成の幅を制御する再設定可能なサンプリング機構を用い、その後複数の専門家によって候補解を生成する。
- 候補を反復的な修正/最終化フェーズで洗練し、正しさを評価するニューラル検証器を用いる。
- クラスタリングに基づく統合ステップでは、候補間の合意(コンセンサス)と解答の品質の両方を用いて最終解を選択する。
- GSM8Kで、AMRは元の学習データのみを用いて75.28%の精度を達成し、合成データで学習された多くの比較可能な7Bモデルを上回る。これは、難易度を考慮したルーティングによる頑健性の向上を示している。

