表データにおける演算スケッチと自己教師あり学習による数値推論の汎化
arXiv cs.LG / 2026/4/24
📰 ニュースModels & Research
要点
- 本論文は、表に基づく数値推論でよく見られる制約として、特定データセット内では高精度でもドメインシフトに弱い点(ヘッダーからのショートカット学習)が問題だと指摘しています。
- TaNOS(Continual pre-training)という枠組みを提案し、(i) ヘッダーの匿名化、(ii) 最小限の構造手がかりを与える「演算スケッチ」、(iii) 表からプログラム先行で正解保証付きのプログラム-質問ペアを作る自己教師あり事前学習の3要素を用います。
- ドメインの意味論と数値演算の構造を分離することで、数値推論の転移可能性(汎化性)を高めます。
- FinQAでは、8Bの指示チューニングモデルでTaNOSを用いると、学習データの10%のみで実行精度80.13%に達し、全データで学習したSFTベースライン(73.97%)を上回り、本文中で挙げられたプロプライエタリ製品も上回ると報告しています。
- ドメインシフト実験では、TaNOSはクロスドメインのギャップが2ポイント未満とほぼ無視できる一方、標準SFTは10ポイント超のギャップを示し、頑健性の改善が大きいことが示されています。


