要旨: 制約付きデコーディングは、大規模言語モデル(LLM)による構造化生成に広く採用されており、出力がJSONやXMLのような事前定義された形式を満たすことを保証している。 しかし、既存の手法の多くはスキーマを純粋に構造的な制約としてのみ扱い、その言語的な定式化がモデル挙動に影響し得るという可能性を見落としている。 本研究では、構造化生成において命令の配置がモデル性能に与える影響を調べ、プロンプトやモデルパラメータを変更せずに、スキーマのキーの表現(言い回し)だけを変えることでも、制約付きデコーディング下でモデル性能が大きく変わり得ることを示す。 この観察に基づき、構造化生成をマルチチャネルの命令問題として再解釈することを提案する。ここでは、命令はプロンプトを通じて明示的に伝達され、デコーディング中はスキーマのキーを通じて暗黙的に伝達される。 知る限り、本研究は、スキーマキーの定式化が暗黙の命令チャネルとしてどのように機能し、制約付きデコーディング下でモデル性能にどう影響するかを、体系的に調べた最初の試みである。 複数の数学的推論ベンチマークでの実験により、異なるモデルファミリがこれらの命令チャネルに対して異なる感度を示すことが明らかになった。すなわち、Qwenモデルは一貫してスキーマレベルの命令の恩恵を受ける一方で、LLaMAモデルはプロンプトレベルのガイダンスにより強く依存する。 さらに、命令チャネル間に非加法的な相互作用効果があることを観察しており、複数のチャネルを組み合わせても必ずしもさらなる改善につながるわけではない。 これらの知見は、スキーマ設計が単に出力構造を決めるだけでなく、命令信号も運ぶことを示唆しており、LLMにおける構造化生成に対する新たな視点を提供する。
制約付きデコーディング下の構造化生成における「スキーマのキー表現」を命令チャネルとして用いる研究
arXiv cs.CL / 2026/4/17
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 構造化生成における制約付きデコーディングはJSONやXMLのような形式を主に「構造上の制約」として満たすことを目的とするが、本研究はスキーマの言語的な書き方がモデル挙動にも影響し得ることを示している。
- プロンプトやモデルのパラメータを一切変えずに、スキーマのキー文言だけを変更することで、制約付きデコーディング下の性能が大きく変わり得ることを実験的に示した。
- 著者らは、構造化生成を「マルチチャネルの命令問題」として捉え直し、プロンプトが明示的な指示を与え、スキーマのキーがデコーディング中に暗黙の命令信号を伝えると提案している。
- 数学的推論ベンチマークでの結果では、モデル系列ごとに感度が異なり、Qwenはスキーマ側の指示で一貫して改善する一方、LLaMAはプロンプト側のガイダンスへの依存がより大きい。
- また、命令チャネル同士の相互作用が加法的ではなく、複数チャネルを組み合わせても必ずしも追加の向上につながらないことが分かった。



