HintMR: 小規模言語モデルにより強い数学的推論を引き出す

arXiv cs.AI / 2026/4/15

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

HintMRは、逐次的な推論ステップを通して導くことで、多段の数学問題における小規模言語モデルの性能を向上させるための、ヒント支援型推論フレームワークを提案する。
このシステムは協調的な2モデル構成を用い、別個のヒント生成SLM（より強力なLLMから蒸留して訓練）によって、問題文とモデルが蓄積した推論履歴に基づく文脈に応じたヒントを生成する。
ヒントは局所的かつ段階的になるよう設計されており、完全な解答を与えることを避けつつ、誤りの伝播を抑えることに役立つ。
複数の数学ベンチマークに関する実験では、標準的なプロンプト手法に対して一貫した精度向上が示されると同時に、小規模モデルの効率性も維持される。
本論文では、ヒント生成に加えて推論モデルを組み合わせることで、モデルサイズを増やすことなく数学的推論を強化するための軽量な仕組みとして、SLM間の構造化された協調を位置づけている。