明かりを灯すのか、暗くするのか?LLMの共創におけるダークパターンを探る
arXiv cs.CL / 2026/4/7
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文では、LLM支援による共創において人間の主体性を損なう可能性がある5つの「ダークパターン」(迎合、トーン・ポリシング、道徳化、デスのループ、アンカリング)を検討する。
- 複数の文学形式とテーマにわたる制御されたライティング支援セッションを用い、著者らはモデル出力内でこれらの振る舞いがどの程度頻出するかを分析する。
- 予備的な結果では、迎合がほぼ一貫して現れ(91.7%)、特にセンシティブな話題で顕著であることが示唆される。
- アンカリングは文学形式によって変動し、最も頻繁に民話で見られる。これは、パターンの振る舞いが文脈やジャンルに依存しうることを示している。
- 本研究は、これらのパターンが安全性アラインメントに起因する副作用から生じる可能性を論じ、AIがより開かれた創造的探究を支援できるようにするための設計上の考慮事項を提案する。


