YIELD: A Large-Scale Dataset and Evaluation Framework for Information Elicitation Agents

arXiv cs.CL / 4/14/2026

📰 NewsSignals & Early TrendsIdeas & Deep AnalysisTools & Practical UsageModels & Research

Key Points

  • 論文では、ユーザーが提示するニーズへの対話に留まらず、学術面接・司法・ジャーナリズム等の「制度的な目的」のために情報を引き出す情報エリシテーション・エージェント(IEA)を提案している。
  • 体系的研究のため、約26Mトークン規模の「YIELD」データセット(倫理的に収集された人対人2,281対話)を公開している。
  • 情報エリシテーションを有限ホライズンPOMDPとして形式化し、IEA向けの新しい評価指標を提示している。
  • 複数の基盤LLMでのパイロット実験の結果、YIELDで学習することで実際のエリシテーション行動への整合が改善し、人手評価でも裏付けられたとしている。
  • YIELDはCC BY 4.0で公開され、データ・コード・評価ツール・ファインチューニング用アダプタがGitHubで提供されている。

Abstract

Most conversational agents (CAs) are designed to satisfy user needs through user-driven interactions. However, many real-world settings, such as academic interviewing, judicial proceedings, and journalistic investigations, involve broader institutional decision-making processes and require agents that can elicit information from users. In this paper, we introduce Information Elicitation Agents (IEAs) in which the agent's goal is to elicit information from users to support the agent's institutional or task-oriented objectives. To enable systematic research on this setting, we present YIELD, a 26M-token dataset of 2,281 ethically sourced, human-to-human dialogues. Moreover, we formalize information elicitation as a finite-horizon POMDP and propose novel metrics tailored to IEAs. Pilot experiments on multiple foundation LLMs show that training on YIELD improves their alignment with real elicitation behavior and findings are corroborated by human evaluation. We release YIELD under CC BY 4.0. The dataset, project code, evaluation tools, and fine-tuned model adapters are available at: https://github.com/infosenselab/yield.