2Dタスクと1Dシリアライズの出会い:構造化タスクにおけるシリアライズ摩擦について

arXiv cs.CL / 2026/5/1

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • この論文は「シリアライズ摩擦」を扱い、LLMが通常2次元構造を1次元トークン列に平坦化することで、行・列の整列や局所近傍といった計算に必要な情報が入力から失われうる点を問題として提示しています。
  • 行列の転置、ConwayのGame of Life、LU分解という明示的2D構造の合成診断タスクを用い、テキストのみの経路と、同じ言語バックボーンを共有しつつタスクに忠実な2Dレイアウトを保持するビジョン併用経路を比較します。
  • その結果、ビジョン併用(2Dを忠実に保つ)経路が、タスクや条件を通じて一貫してテキスト(シリアライズ)経路を上回ることが示されます。
  • 次元が大きくなるほど性能差は拡大し、シリアライズ時の誤りはより空間的に構造化されたパターンとして現れることが報告されます。
  • 著者らは、タスクに関連する2Dレイアウトを入力で保存することが有望な方向性であり、さらなる検討が必要だと結論づけています。