AI Navigate

機械学習におけるアルゴリズム発見タスクの手続き的生成

arXiv cs.LG / 2026/3/19

📰 ニュースModels & Research

要点

  • DiscoGen は、機械学習のアルゴリズム発見タスクを手続き的に生成するジェネレーターであり、新しい ML アルゴリズムの自動作成と評価を可能にします。
  • これまでのタスク群の主要な限界、例えば評価方法の不適切さ、データの混入、類似問題の飽和を解決します。
  • このジェネレーターは、複数の ML 分野にまたがる数百万のタスクを、少数の設定集合によってパラメータ化して提供し、アルゴリズム発見エージェント(ADA)の最適化に使用できます。
  • また、原理的な ADA 評価のための固定された小規模ベンチマークサブセットである DiscoBench を含み、ADA のプロンプト最適化といった実験をサポートします。
  • 本プロジェクトはオープンソースで、GitHub にホストされており、研究者がアルゴリズム発見の新しい方向性を探ることを歓迎します(https://github.com/AlexGoldie/discogen)。

要約: 機械学習アルゴリズムの開発を自動化することは、新たなブレークスルーを生み出す可能性を秘めています。しかし、アルゴリズム発見システムの改善と評価能力は、これまで既存のタスクスイートによって制限されてきました。それらには、評価手法が不適切であること、データの混入、飽和したり非常に類似した問題を含んでいるなど、さまざまな問題があります。ここで、機械学習のアルゴリズム発見タスクを生成する手続き型ジェネレーター DiscoGen を紹介します。例えば、強化学習のオプティマイザの開発や画像分類の損失関数の設計など。強化学習における手続き型生成の成功に動機づけられ、DiscoGen は機械学習のさまざまな分野にわたる、難易度と複雑さの異なる数百万のタスクを網羅します。これらのタスクは、少数の設定パラメータによって規定され、アルゴリズム発見エージェント(ADA)の最適化に利用できます。私たちは DiscoBench を提示します。DiscoGen タスクの固定された小さなサブセットから構成され、ADA の原理的評価のためのベンチマークです。最後に、DiscoGen によって実現される野心的で影響力のある研究方向をいくつか提案します。さらに、ADA のプロンプト最適化への利用を示す実験も紹介します。DiscoGen は https://github.com/AlexGoldie/discogen にてオープンソースとして公開されています。