微調整データにおける能力ギャップの診断
arXiv cs.LG / 2026/5/1
📰 ニュースIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- この論文では、GoalCoverという枠組みを提案し、目標を原子的なサブゴールに分解してカバレッジを評価することで、費用のかかるLLMの微調整前にデータセットの能力ギャップを診断できるようにします。
- GoalCoverは各サブゴールごとに学習サンプルへLLMベースのアラインメントスコアを割り当て、スコアが低いサンプルの説明から不足している能力を特定します。
- 医療QA、法的要約、コード生成の3領域での制御された改変実験により、GoalCoverが「標的となる能力」の劣化と「非標的」の影響を信頼性高く区別できることが示されました(平均劣化25.6%対2.1%、Cohen’s d=1.24)。
- Qwen-3-14Bを用いた金融要約の強化微調整タスクでは、GoalCoverでフィルタしたデータによりLLMジャッジの報酬が3.77から4.12に改善し、最良結果はフィルタ済みデータとゴール条件付き合成サンプルの組み合わせで達成されました(4.20)。




