ProUIE:LLMベースのユニバーサル情報抽出のためのマクロからミクロへの漸進的学習手法
arXiv cs.CL / 2026/4/14
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、外部情報を追加することなく結果の改善を目指す、LLMベースのユニバーサル情報抽出のためのマクロからミクロへの漸進的学習手法であるProUIEを提案する。
- ProUIEは3つの段階で構成される。完全モデリング(CM)で、内在的な難易度の順にNER/RE/EEを学習し、簡素化されたアラインメント(SA)で構造化された出力を正則化して簡略化し、GRPOを用いた深い探索(DE)で段階的なきめ細かな報酬により学習を進める。
- 36の公開データセットにわたる実験により、ProUIEはユニファイド抽出の性能を一貫して向上させ、NERおよびREにおいて強力な指示チューニング済みベースラインを上回ることが示される。
- 本手法はより小さなバックボーンでこれらの改善を達成し、大規模でプロダクション志向の情報抽出設定において明確な向上を報告する。




