表の推論のためのプラトン的表現へ:順列不変な検索の基盤

arXiv cs.AI / 2026/4/15

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、多くのNLPパイプラインで用いられるように表を線形化して表現すると、重要な幾何学的および関係的構造が失われ、その結果としてモデルがレイアウトの順列に対して脆くなると主張する。
  • 「プラトン的表現仮説(PRH)」を導入し、表の推論のための潜在空間は、意味的安定性を保つために本質的に順列不変であるべきだと述べる。
  • 著者らは、「直列化バイアス(serialization bias)」を評価するための形式的な診断法を提案する。具体的には、Centered Kernel Alignment(CKA)に基づく2つの指標により、構造的なデランジュメントの下での埋め込みのドリフトや、正準的な潜在構造へ収束していく様子を測定する。
  • 実験結果は、現代のLLMベース手法が脆弱であることを示唆する。つまり、表のレイアウトに小さな変更が入るだけで、表埋め込みが大きく、しかも不釣り合いに変化することがある。これにより、RAGシステムが意味ではなくレイアウトのノイズに敏感になってしまう恐れがある。
  • この問題に対処するため、本論文は構造を考慮した表表現学習(TRL)エンコーダを提示する。セルのヘッダ整合を強制することで、幾何学的な安定性を高め、順列不変な検索へ近づける。