UnIte:不確実性に基づく反復的ドキュメントサンプリングによる情報検索のドメイン適応
arXiv cs.AI / 2026/4/29
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、不確実性ベースの反復的ドキュメントサンプリング手法UnIteを提案し、ニューラル情報検索モデルの教師なしドメイン適応を改善する。
- UnIteは疑似クエリ生成のために、高いアレアトリック不確実性を持つ文書をフィルタリングし、高いエピステミック不確実性を持つ文書を優先することで、現時点のモデルの学習効率を最大化する。
- 既存手法が多様性の最適化に偏っていたのに対し、UnIteはモデルの不確実性をより適切に捉えて適応用の文書選択を行う。
- BEIRでの広範な実験では、小型・大型モデルの双方で、平均約4kの学習サンプル数という少なさながら、nDCG@10が+2.45および+3.49と大きく向上したことを示している。




