タスクのネットワーク上でのマルチタスク最適化

arXiv cs.AI / 2026/4/27

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文では、タスク空間をグラフとして表現し、タスクをノード、パラメータ空間上で近いタスク同士をエッジで結ぶことで動作するマルチタスク最適化手法「MONET」を提案している。
MONETは、固定的な離散化アーカイブに依存してタスク空間のトポロジーを無視しがちな既存手法の限界や、スケールしにくい人口ベース手法の課題を、数千規模の大規模タスクセットでも扱える形で克服しようとしている。
具体的には、近傍ノードからクロスオーバーで候補を生成する「ソーシャル学習」と、各ノードの解を突然変異で独立に改良する「個別学習」を組み合わせる。
4つのベンチマーク（archery、arm、cartpoleはいずれも5,000タスク、hexapodは2,000タスク）で評価した結果、MONETは全ドメインでMAP-Elites系ベースラインの性能に少なくとも同等、または上回ることを示している。

Abstract

マルチタスク最適化は、多数のタスクを並列に解くための強力なアプローチである。しかし、既存のアルゴリズムには明確な制約がある。母集団ベースの手法は大規模なタスク集合に対してスケールしにくく、また大きなタスク集合に対する探索は十分に研究されていない。千タスクを超えてスケールするアプローチの多くは MAP-Elites のバリアントであり、タスク空間のトポロジを無視する、固定された離散化アーカイブに依存している。我々は MONET（Multi-Task Optimization over Networks of Tasks）を導入する。MONETは、タスク空間をグラフとしてモデル化するマルチタスク最適化アルゴリズムである。タスクはノードで表され、エッジはタスクのパラメータ空間においてタスク同士を結ぶ。この表現により、タスク間での知識移転が可能になり、高次元の問題に対しても扱いやすいままでありつつ、タスク空間のトポロジを活用できる。 MONETは、近隣ノードから交叉によって候補を生成する社会的学習と、突然変異によってあるノード自身の解を独立に改良する個別学習を組み合わせる。我々は MONETを4つのドメイン（弓道、腕、そして各5,000タスクの cartpole；2,000タスクのヘキサポッド）で評価し、4つの全ドメインにおいて、既存の MAP-Elites ベースのベースラインの性能に対して同等、または上回ることを示す。