学習する質問:LLMエージェントが不明確な指示に直面したとき
arXiv cs.CL / 2026/4/30
💬 オピニオンDeveloper Stack & InfrastructureTools & Practical UsageModels & Research
要点
- この論文は、外部ツールを呼び出せるLLMエージェントが、ユーザーの不完全で不明確な指示下でどのように振る舞うかを調査し、実際に問い合わせられた指示を用いて誤りパターンを分析します。
- Noisy ToolBench(NoisyToolBench)という、ノイズの多い条件でのツール利用を厳しく検証するベンチマークを提案しています。
- 著者らは、次トークン予測の学習目的により、モデルが欠けた引数を恣意的に補完してしまい、幻覚(ハルシネーション)のリスクが高まることを示しています。
- これに対処するため、指示が不明確で障害に遭遇したときに、LLMがユーザーに確認の質問をする「Ask-when-Needed(AwN)」という枠組みを提案します。
- さらに、評価を自動化するToolEvaluatorも構築し、実験ではAwNがNoisyToolBench上で既存のツール学習手法より大きく優れていることを示し、関連コードとデータセットの公開も予定しています。




