マルチリンガル推論ジム: 手続き的推論環境の多言語スケーリング
arXiv cs.CL / 2026/3/12
📰 ニュースTools & Practical UsageModels & Research
要点
- マルチリンガル推論ジムは Reasoning Gym を拡張し、手続き的に検証可能な推論問題を14言語で生成します。
- 10言語でネイティブスピーカーによる検証を付した94のタスクテンプレートを翻訳し、言語的自然さを確保するためにコードやテンプレートの適応を行います。
- 元の Reasoning Gym で用いられた手続き的生成アプローチの核となる利点を維持し、ほぼ無限の問題インスタンス生成と難易度調整を可能にし、検証可能報酬からの強化学習と評価設定に直接利用できます。
- 問題は言語間で並列化され、手続き的な性質のため大規模なクロス言語データ生成を可能にします。著者は多言語推論研究を支援するために実装を公開します。
本稿では、Reasoning Gym (Stojanovski ら, 2025) の拡張として、14言語にわたり検証可能な推論問題を手続き的に生成する Multilingual Reasoning Gym を提示します。私たちは 10言語でネイティブスピーカーによる検証を付した 94 のタスクテンプレートを翻訳し、言語的自然さを確保するためのコードまたはテンプレートの適応を行います。Multilingual Reasoning Gym は、元の Reasoning Gym で用いられた手続き的生成アプローチの核となる利点、すなわちほぼ無限の問題インスタンス生成と難易度の調整可能性を維持し、検証可能な報酬からの強化学習および評価設定に直接利用可能です。Multilingual Reasoning Gym の問題は言語間で並列であり、環境の手続き的性質により大規模なスケールでのクロスリンガルデータ生成を可能にします。私たちは多言語推論モデルの研究を支援するために、実装を公開します。