LLMに対する文脈依存の制御を学習・強制する
arXiv cs.CL / 2026/4/14
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、LLM出力に対する文脈依存の制御制約を自動的に学習するための枠組みを提案し、従来手法が抱えていた制約の手動指定という負担を解消することを目的としています。
- 2段階のパイプラインを用います。まず学習のために構文的探索によって多様なモデル出力を収集し、次に制約活用によって生成中に学習したルールを強制します。
- 実験の結果、この手法は小規模な1BパラメータのLLMでも制約遵守を完全に達成できることが示され、報告によれば、より大きなモデルや一部の最先端の推論システムよりも優れています。
- 著者らは、文脈依存の文法学習をLLM生成に直接統合する点で初の試みだと主張しており、手作りの制約を用いることなく生成の妥当性を保つことを目指しています。
