多目的進化的マージによる効率的推論モデルの実現
arXiv cs.CL / 2026/4/9
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、長文から短文への(Long-to-Short; L2S)推論問題に取り組み、高い精度を維持しつつ生成トークン数を減らすことで、長い連鎖的思考(chain-of-thought)推論に伴う推論時のコストを削減することを目指す。
- Evo-L2Sを提案し、L2Sモデルのマージを多目的最適化問題として再定式化する。パレートフロント上のマージ済みモデル群を用いて、進化的モデルマージにより精度と出力長のトレードオフを明示的に最適化する。
- 大規模言語モデルに対する進化探索を実行可能にするため、エントロピーに基づく部分集合サンプリングにより、適応度推定のオーバーヘッドを削減する手法を用いる。
- 1.5B、7B、14Bのモデル規模にまたがる推論ベンチマークでの実験により、Evo-L2Sは元の推論モデルに対して精度を維持または向上させながら、推論トレース長を50%以上削減できることが示される。



