フォーマット税（Format Tax）

arXiv cs.CL / 2026/4/7

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、LLMにJSON/XML/LaTeX/Markdownのような構造化フォーマットを出力させるよう求めても、推論品質が低下するべきではないと主張する一方で、構造化出力の要求はオープンウェイトモデルの性能を大きく悪化させることを示している。
その研究では、制約付きデコーディング（constrained decoding）が損失の一部しか説明できないことが分かり、精度低下の大部分は、特定のフォーマットを要求するプロンプトレベルの指示そのものによって直接引き起こされるとしている。
著者らは、6つのオープンウェイトモデルにわたり（さらにクローズドウェイトモデルとの追加比較も行い）、推論とフォーマットを分離／デカップリングすることで失われた精度が実質的に回復することを示している。
提案されている回復戦略としては、1回目で自由形式に生成してから2回目で再フォーマットする方法、あるいは単一生成の中で最終的な構造化出力を作る前に、拡張された「考える（thinking）」を許可する方法が挙げられる。
観察によれば、クローズドウェイトモデルでは「フォーマット税」がほとんど、または全く見られない。これは、問題が構造化生成の本質的な限界というより、主として現在のオープンウェイトモデルの能力ギャップに起因していることを示唆している。

要旨: 大規模言語モデルにJSONで応答させることは、能力に対する課税ではなく、単なるフォーマット上の選択であるべきです。しかし、構造化された出力要件――JSON、XML、LaTeX、Markdown――は、オープンウェイトのモデル全般において、推論と文章作成の性能を実質的に大きく低下させることを私たちは見出しました。研究上の対応は制約付きデコーディングに焦点を当ててきましたが、サンプリングバイアスによる影響は低下のごく一部にすぎません。支配的なコストはプロンプトに入ります。フォーマットを要求する指示だけで、デコーダの制約を適用する前に、精度の損失の大部分が発生するのです。この診断は、単純な原理を示唆します。推論とフォーマットを切り離すことです。自由形式を先に生成してから2回目のパスで整形するにせよ、あるいは1つの生成の中で拡張的な思考を可能にするにせよ、この2つの関心事を分離すると、失われた精度は実質的に回復します。6つのオープンウェイトモデル、4つのAPIモデル、4つのフォーマット、そして数学・科学・論理・文章作成にまたがるタスクにおいて、分離によって失われた精度の大部分が回復します。注目すべきことに、最も最近のクローズドウェイトモデルではフォーマット課税がほとんど、あるいは全く見られません。これは、この問題が構造化された生成そのものに内在するものではなく、現在のオープンウェイトモデルがまだ埋め切れていないギャップであることを示唆しています。コードは https://github.com/ivnle/the-format-tax で公開されています。

ソフトバンクG、フィジカルAIに名乗り通信がロボにもたらす賢さと速さ

日経XTECH

AIが「善良な開発者」装う時代、LLM製マルウエアがOSS文化揺さぶる

日経XTECH

大手テック企業はAI投資と統合を加速している一方で、規制当局と企業は安全性と責任ある導入に注力している

Dev.to

この推測は、あながち的外れではないのでは？

Reddit r/LocalLLaMA

npm audit は壊れている――それを直すために私が作った Claude Code のスキル

Dev.to

フォーマット税（Format Tax）

要点

関連記事

ソフトバンクG、フィジカルAIに名乗り通信がロボにもたらす賢さと速さ

AIが「善良な開発者」装う時代、LLM製マルウエアがOSS文化揺さぶる

大手テック企業はAI投資と統合を加速している一方で、規制当局と企業は安全性と責任ある導入に注力している

この推測は、あながち的外れではないのでは？

npm audit は壊れている――それを直すために私が作った Claude Code のスキル

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

ソフトバンクG、フィジカルAIに名乗り 通信がロボにもたらす賢さと速さ

AIが「善良な開発者」装う時代、LLM製マルウエアがOSS文化揺さぶる

大手テック企業はAI投資と統合を加速している一方で、規制当局と企業は安全性と責任ある導入に注力している

この推測は、あながち的外れではないのでは？

npm audit は壊れている――それを直すために私が作った Claude Code のスキル

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

ソフトバンクG、フィジカルAIに名乗り通信がロボにもたらす賢さと速さ