OmniTabBench:大規模な表形式データにおけるGBDT、ニューラルネットワーク、基盤モデルの経験的フロンティアをマッピングする

arXiv cs.LG / 2026/4/9

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、3,030のデータセットからなる大規模な表形式データ向けベンチマーク「OmniTabBench」を紹介する。多様なタスクにまたがり、さまざまなソースから収集され、大規模言語モデルを用いて業界別に分類されている。
  • 樹木ベースのアンサンブル、ニューラルネットワーク、基盤モデル系の手法に至る最先端モデルを対象に、大規模な評価を報告し、常に一つのパラダイムが優位に勝ち続けるわけではないことを見出す。
  • デカップルドなメタ特徴量分析(データセットのサイズ、特徴量の種類、歪度や尖度などの特徴量/目的変数の分布特性など)を用いて、異なるモデルの系統がより良い性能を示す条件を特定する。
  • 著者らは、OmniTabBenchが先行ベンチマークの限界—特に小規模ベンチマーク(<100データセット)や、選択バイアスの可能性—を、より頑健でスケールに適した経験的エビデンスによって解決する、と主張している。