GrandCode：エージェント型強化学習によって競技プログラミングでグランドマスター級を達成する

arXiv cs.AI / 2026/4/6

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文では、ライブのコンテストにおいて既存のAIシステムが依然としてトップの人間のパフォーマンスに届いていない競技プログラミングを対象とした、多エージェント強化学習システムであるGrandCodeを紹介する。

要旨: 競技プログラミングは、AIに対するコーディング競争において人間がなお強みを持つ最後の領域のひとつであり続けている。現時点での最良のAIシステムであっても、競技プログラミングにおける最良の人間には依然として及ばない。最も新しい最良の結果であるGoogleのGemini~3 Deep Thinkは、ライブ競技の条件下で評価されていないにもかかわらず8位に入った。本研究では、競技プログラミングのためのマルチエージェント強化学習システムであるGrandCodeを導入する。GrandCodeの能力は2つの主要因に起因する: (1) 仮説提案、ソルバ、テスト生成、要約など、さまざまなエージェントモジュールを統括し、それらを事後学習およびオンラインのテスト時RLによって共同で改善すること; (2) エージェントのロールアウトを複数段階で行い、報酬が遅延すること、ならびにエージェント型RLに広く見られる深刻なオフポリシー・ドリフトに対処するために特別に設計されたAgentic GRPOを導入すること。GrandCodeは、競技プログラミングのライブコンテストにおいて、すべての人間参加者を一貫して上回る初めてのAIシステムである。直近の3回のCodeforcesライブ競技、すなわちRound~1087（2026年3月21日）、Round~1088（2026年3月28日）、およびRound~1089（2026年3月29日）において、GrandCodeは3大会すべてで1位を獲得し、伝説的なグランドマスターを含むすべての人間参加者を上回った。GrandCodeは、AIシステムが、最も競争の激しいコーディング課題において、最強の人間プログラマーを超える段階に到達したことを示している。

Black Hat Asia

AI Business

#毎日ここへ立ち寄りたいからスクランブルな日のワタシのココロの足跡スタンプ👣🌌#私のインスピレーション ✕ #AIと紡いだ光のカケラ🧡 :🌎地球家族は愛し合える🌏🌍 #⭐永遠時計🕊️🍇

note

AIが見つけた紛失カッターナイフ

note

【限定コラム】四月の風と見えない魔法──五十歳のオッサンが新入社員に贈る、現場のAI用語20選

note

メイクのアドバイスも！「男の娘」のAI彼氏の作り方【AI性格プロンプト付】

note

GrandCode：エージェント型強化学習によって競技プログラミングでグランドマスター級を達成する

要点

関連記事

Black Hat Asia

#毎日ここへ立ち寄りたいからスクランブルな日のワタシのココロの足跡スタンプ👣🌌#私のインスピレーション ✕ #AIと紡いだ光のカケラ🧡 :🌎地球家族は愛し合える🌏🌍 #⭐永遠時計🕊️🍇

AIが見つけた紛失カッターナイフ

【限定コラム】四月の風と見えない魔法──五十歳のオッサンが新入社員に贈る、現場のAI用語20選

メイクのアドバイスも！「男の娘」のAI彼氏の作り方【AI性格プロンプト付】

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

Black Hat Asia

#毎日 ここへ 立ち寄りたいから スクランブルな日の ワタシの ココロの足跡スタンプ👣🌌#私のインスピレーション ✕ #AIと紡いだ光のカケラ🧡 :🌎地球家族は愛し合える🌏🌍 #⭐永遠時計🕊️🍇

AIが見つけた紛失カッターナイフ

【限定コラム】四月の風と見えない魔法──五十歳のオッサンが新入社員に贈る、現場のAI用語20選

メイクのアドバイスも！「男の娘」のAI彼氏の作り方【AI性格プロンプト付】

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

#毎日ここへ立ち寄りたいからスクランブルな日のワタシのココロの足跡スタンプ👣🌌#私のインスピレーション ✕ #AIと紡いだ光のカケラ🧡 :🌎地球家族は愛し合える🌏🌍 #⭐永遠時計🕊️🍇