オブジェクト記述に対する推論がタスク指向対話システムのコアファレンス解決を改善する
arXiv cs.CL / 2026/5/1
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本研究は、視覚的に根拠づけられた環境やメタデータが多様な状況での物体参照の結び付けが難しい点を踏まえ、タスク指向対話システムにおけるコアファレンス解決を扱う。
- 詳細なオブジェクトメタデータと対話履歴を用い、推論によりコアファレンス解決を改善するための、単一モーダルのテスト時推論アプローチを提案する。
- SIMMC 2.1データセットでの実験では、LLMが段階的な推論を生成し、対話文脈とシーン内の物体を効果的に対応付けられることが示される。
- few-shot設定でのテスト時推論は、未見のシナリオや新しいオブジェクトに対しても良好に一般化し、クロスドメイン評価でエンコーダ型の教師あり手法より優れることを示す。




