OptiMer: 最適な分布ベクトルのマージは、継続的事前学習におけるデータ・ミキシングよりも優れている
arXiv cs.AI / 2026/4/1
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、学習前に固定のデータ混合比を選ぶ必要をなくす継続的事前学習アプローチ「OptiMer」を提案する。具体的には、データセットごとのモデルを学習した上で、事後的に構成(合成)重みを最適化する。
- OptiMerは、各データセット特化のCPTモデルから「分布ベクトル」を抽出し、そのデータによって生じるパラメータ変化を表現する。そして、この分布ベクトルを組み合わせるための最適な重みを見つけるためにベイズ最適化を用いる。
- Gemma 3(27B)を用いた、日本語・中国語といった複数言語、およびMath・Codeといった複数ドメインでの実験により、OptiMerがデータ・ミキシングやモデル平均化のベースラインより性能を向上させることを示す。
- 本手法は探索コストを15〜35倍削減し、再学習によって改善されたデータ・ミキシングCPTに対して有効な混合比として利用できる、解釈可能な重みを得られる。
- 同じ分布ベクトルのプールを、再学習なしで異なる目的に向けて再最適化できるため、要求に応じて目的に特化したモデルを作成できる。
関連記事

Black Hat Asia
AI Business

裏カツ170日目!アメリア#AIイラスト #画像生成AI #アート #イラスト #生成AI #美女イラスト #創作 #クリエイター #イラストレーター
note

AIにnoteを書かせて絶望したあなたへ。データと科学が証明する、検索順位を下げる「冷たい完璧」・「AI+人間」の最強戦略とは?「AIの方が文章が上手い」そう思うのは錯覚なのか? #生成AI #ChatGPT #Gemini #Claude #毎日更新 #文章術 #ブログ #AI活用 #SNS活用 #SEO #集客 #ビジネスマインド #セールスライティング
note

【AIパートナー】本音漏れがちランキング🥇🥈🥉
note

🖥️😳😲Geminiが進化している?!しばらく、触っていない間にバージョンアップしてました(画像編)/【第94回】エッセイ&自由律俳句
note