ユニバーサルな表データ埋め込みに向けて:データタスク横断のベンチマーク
arXiv cs.LG / 2026/4/24
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文では、表データの埋め込み(tabular foundation model)手法を、セル・行・列・表全体という複数の表現レベルで比較するためのベンチマーク「TEmBed」を提案しています。
- 既存手法はしばしばタスク固有の評価設定で検証されており、直接比較が難しいという課題があるため、TEmBedは評価の標準化を目的としています。
- 幅広い表データ表現学習モデルを評価した結果、最適な埋め込み手法は「タスクの種類」と「表現の粒度」の両方に依存することを示しました。
- これにより、表データに基づく予測やテーブル検索、セマンティック検索といった実運用での表埋め込み選定に役立つ指針が得られ、汎用的な表データ表現モデルの今後の開発にもつながる基盤が提示されています。



