調査回答生成:大規模言語モデルでインシリコに閉形式のアンケート回答を生成する
arXiv cs.CL / 2026/4/27
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、LLMが主に自由記述を生成するよう訓練されている一方で、インシリコで閉形式のアンケート回答を作る「Survey Response Generation(SRG)方法」が予測回答の質にどう影響するかを体系的に検証します。
- 32百万件のシミュレーション回答を用い、4つの政治的態度に関するアンケート課題と10のオープンウェイト・言語モデルに対して、8種類のSRG手法を比較します。
- SRG手法の選択は、個人レベルだけでなくサブ集団レベルでも、予測回答との整合性(アラインメント)に大きな差を生むことが示されます。
- 全体としては「Restricted Generation Methods」が最も良い性能を示し、推論(reasoning)出力の付与は整合性の改善に一貫して寄与しないことが分かります。
- 著者らは、LLMでアンケート回答をシミュレーションする際のSRG手法の選び方・適用方法について、実用的な推奨事項を提示します。




