Copilotで検証するTDLとUSJの満足度対決、いくど議論してもTDL勝者となるLLMの特性を考察した

Zenn / 2026/4/20

💬 オピニオンIdeas & Deep AnalysisTools & Practical Usage

要点

  • Copilotを用いてTDLとUSJの満足度を「検証」し、どのように比較が成立するかを議論する内容である。
  • いくど議論してもTDLが勝者になりやすいという現象を起点に、LLM(Copilot)の振る舞いの特性を考察している。
  • LLMが示す結論が一貫しやすい(または特定の側に寄りやすい)背景として、回答の誘導・前提の取り方・評価軸の固定化などの要因を示唆している。
  • レジャー(満足度)という主観指標の比較にLLMを使う際、プロンプト設計や検証手順の妥当性が結果に強く影響する点を浮き彫りにする。
LLMの特性を調べようと、二つの専門家ロールを演じさせ、反復議論で「どちらのテーマパークが顧客満足度で優位か」を決定させる手法を検証してみまみました。 そして楽しさも入れようと、生成AI/CopilotにはCopilot_D(TDR専門)とCopilot_U(USJ専門)を設定し、30ラウンド以上の深い議論を実施します。 得られた結果は一貫して東京ディズニーランドが勝者となったが、本章ではまず手法の意図と期待される知見を整理、期待される利点は、短時間で大量の議論データを生成し、モデルの主張安定性や揺らぎを観察できる点である。 その一方で探索的手法に仮説生成には有効だが、単独で因果的結論や...

この記事の続きは原文サイトでお読みいただけます。

原文を読む →