メタ特徴量と知識グラフ埋め込みを統合したメタ学習

arXiv cs.LG / 2026/3/23

📰 ニュースIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • KGmetaSPは、既存の実験データを利用してデータセットとパイプラインの相互作用を捉える知識グラフ埋め込みアプローチを導入し、メタ学習タスクPPEおよびDPSEを対象とする。
  • データセットとパイプラインを統一された知識グラフとして表現し、パイプラインに依存しないPPEとDPSEのための距離ベースの検索を支援する。
  • 著者らは、この手法を、144,177件のOpenML実験を含む大規模ベンチマークで検証し、豊富なデータセット間の評価を可能にしている。
  • KGmetaSPは、パイプラインに依存しない単一のメタモデルでPPEの精度を高め、DPSEの性能をベースラインより改善する。
  • 著者らはKGmetaSP、知識グラフ、およびベンチマークを公開し、分野におけるメタ学習の新たな参照点を確立している。

要旨: ウェブ上で利用可能な機械学習レコードの膨大なコレクションは、過去の実験を活用して性能を改善するメタラーニングに対して重要な機会を提供します。2つの重要なメタラーニングタスクは、ターゲットデータセットに対するパイプラインの性能を予測するパイプライン性能推定(PPE)と、データセットの性能パターンに基づく類似性推定(DPSE)であり、同様の性能パターンを持つデータセットを特定します。既存のアプローチは主にデータセットのメタ特徴量(例:インスタンス数、クラスエントロピー等)を用いてデータセットを数値的に表現し、これらのメタラーニングタスクを近似します。しかし、これらのアプローチは、利用可能な過去の実験結果やパイプラインメタデータの豊富さを見落とすことが多いです。これにより、データセットとパイプラインの相互作用を捉え、性能の類似性パターンを明らかにする能力が制限されます。本研究では、既存の実験データを活用してこれらの相互作用を捉え、PPEとDPSEの両方を改善する知識グラフ埋め込みアプローチであるKGmetaSPを提案します。データセットとパイプラインを統一された知識グラフ(KG)内に表現し、PPEのパイプライン非依存のメタモデルとDPSEの距離ベース検索を支える埋め込みを導出します。私たちのアプローチを検証するため、OpenML実験144,177件を含む大規模ベンチマークを構築し、豊かなクロスデータセット評価を可能にします。KGmetaSPは、単一のパイプライン非依存メタモデルを用いて高精度なPPEを実現し、ベースラインよりもDPSEを改善します。提案されたKGmetaSP、KG、およびベンチマークを公開し、メタラーニングの新たなリファレンスポイントを確立するとともに、公開実験データを統一KGへ統合することが分野を前進させることを示しています。