Gemini 対 Grok:『Towers of Annoy(うるさい塔)』で対戦する

Reddit r/artificial / 2026/4/24

💬 オピニオンSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • 大規模言語モデルは、2人の対戦型ハノイの塔に参加するための Python 3.10 クライアントを作る課題を与えられました(ヴィランは同じディスクを隣接タワーへ即時に移す必要があります)。
  • ヒーローの移動回数は 2^m + 1 に設定され、ソロ最適の 2^m - 1 をわずかに上回るだけなので、無駄な手はほぼ確実に敗北につながります。
  • ラウンドロビン方式で総当たりを行い、最大5ラウンド(必要に応じてサドンデス)で対戦し、各ラウンドでは役割を入れ替えた2本の同時対局が実施されました。
  • 難易度は 4タワー/3ディスクから 12タワー/7ディスクまで段階的に拡大し、ますます複雑な対戦的な計画能力が試されました。
  • 詳細なレポートでは、Gemini が好成績だった(「エース」した)ことが紹介され、トーナメント設定の結果にも触れています。
Gemini vs Grok: Playing Towers of Annoy

LLMには、2人対戦の敵対的バリアントである『ハノイの塔』をプレイするPython 3.10クライアントを書くよう求められました。

ルール:主人(Hero)はディスクを1枚動かします。悪役(Villain)は、直ちにその同じディスクを隣接する別の塔へ動かさなければなりません(合法手がない場合はパス)。主人の持ち時間(予算)は2^m + 1手——一人用の最適解である2^m - 1手を、わずかに上回るだけなので、ほぼあらゆる無駄な手が負けにつながります。総当たりトーナメントでペナルティ・シュートアウト方式の対戦カード:最大5ラウンド(延長戦あり)、各ラウンドで同時に2試合を行い、主人/悪役の役割を入れ替えます。対戦設定は、4つの塔/3つのディスクから、12の塔/7つのディスクへと拡大します。

詳細な書き起こし

提出者 /u/reditzer
[リンク] [コメント]