アイデアの精緻化がアイデアの独創性の自動評価に与える影響
arXiv cs.AI / 2026/4/25
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本研究は、分岐的思考タスク(Alternate Uses Task)において、アイデアの独創性を自動評価する際に、大規模言語モデル(LLM)が人間の判断をどの程度再現できるかを検証しています。
- トレーニングを受けた学生の人間評価を、AUTに基づく2つの専門システムの微調整モデルおよび同一の指示でプロンプトしたChatGPT-4oと比較しました。
- 結果として、自己選好バイアスが確認され、LLMベースの自動評価は、人間の創造性というよりモデル自身の文体に似た出力を優先しやすいことが示されました。
- 重要なのは、アイデアの精緻化(elaboration)の度合いで分析を制御すると、自己選好バイアスが消失した点です。
- これらの知見は、自動化された創造性評価の将来の研究に向けた理論的・方法論的な示唆を論じています。



