本論文は、ICLR 2026におけるFoundation Models(NADPFM)を対象としたデータ課題のナビゲートおよび対処に関するワークショップで採択されました。
原理に基づくドメインの再重み付けは、サンプル効率および下流での汎化を大きく改善し得ます。しかし、マルチモーダル事前学習におけるデータ混合の最適化は、十分に研究されていません。現在のマルチモーダル学習レシピでは、データ形式やタスク種別といった単一の観点から混合比を調整しています。そこで我々は、ドメインの体系的な分解と小型のプロキシモデルを用いることで、計算効率の高いマルチモーダル混合最適化を実現する、原理に基づく枠組みMixAtlasを導入します…


