KumoRFM-2: 関係学習のための基盤モデルをスケールする

arXiv cs.LG / 2026/4/15

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • KumoRFM-2は、関係データ向けに設計された新しい事前学習済み基盤モデルであり、インコンテキスト学習および多様な予測タスクにまたがる微調整を可能にします。
  • 表形式の基盤モデルとは異なり、手動のフラット化や目的変数の生成を行うことなく、接続されたテーブルをそのまま統合して扱え、かつ時間的な整合性を保持します。
  • 本モデルは、4つの表現軸(テーブル内の行/列と、データベース間の外部キー/サンプル横断)にわたって、合成データと実世界データの混合で事前学習されています。
  • 重要なアーキテクチャ/学習上の変更点は、タスク情報をより早い段階で注入することであり、タスクに関連する列の選択が改善され、ノイズの多い入力に対する頑健性も高まります。
  • 41のベンチマークでの実験では、教師あり手法や他の基盤アプローチに比べて最大8%の向上が示されました。コールドスタートやノイズの多い条件下でも強い性能を発揮し、億(billion)規模の関係データセットにもスケールします。