YIELD:情報エリシテーション・エージェントのための大規模データセットと評価フレームワーク
arXiv cs.CL / 2026/4/14
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- 本論文では、ユーザーが提示するニーズへの対話に留まらず、学術面接・司法・ジャーナリズム等の「制度的な目的」のために情報を引き出す情報エリシテーション・エージェント(IEA)を提案している。
- 体系的研究のため、約26Mトークン規模の「YIELD」データセット(倫理的に収集された人対人2,281対話)を公開している。
- 情報エリシテーションを有限ホライズンPOMDPとして形式化し、IEA向けの新しい評価指標を提示している。
- 複数の基盤LLMでのパイロット実験の結果、YIELDで学習することで実際のエリシテーション行動への整合が改善し、人手評価でも裏付けられたとしている。
- YIELDはCC BY 4.0で公開され、データ・コード・評価ツール・ファインチューニング用アダプタがGitHubで提供されている。

