[AI] Chat GPT5.2 thinking:東大理三入試最高点を50点超えの衝撃

note / 2026/5/1

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • ChatGPT 5.2の「thinking」機能が、東大理科三類入試で最高点を50点超えるとする衝撃的な検証結果を紹介しています。
  • 生成AIが高難度の推論・問題解決において、試験成績という分かりやすい指標で高い性能を示し得る点を強調しています。
  • 文章からは具体的な手法(評価設計・問題種別・再現性)や数値根拠の詳細までは読み取れないものの、「推論能力の向上」を受験レベルで示したという主張が中心です。
  • AIの能力評価が従来のベンチマークに留まらず、実課題(入試)へ拡張されているというシグナルとして受け止められます。
見出し画像

[AI] Chat GPT5.2 thinking:東大理三入試最高点を50点超えの衝撃

52



プロローグ:4月、桜、そして50点の衝撃

2026年4月27日。

例年であれば、新入生たちが駒場のキャンパスで慣れない講義に目を輝かせ、サークル勧誘の喧騒がようやく落ち着きを見せる頃。

そんな春の昼下がりに飛び込んできたニュースは、日本の教育、あるいは「知性」という概念そのものを揺るがす、あまりに象徴的な一撃でした。

「チャッピー」という、少し愛嬌のある愛称で呼ばれるAI――OpenAIの『ChatGPT-5.2 Thinking』が、今年の東大入試で「首席」相当の成績を収めたというのです。

それも、単なる合格ではありません。日本最難関とされる理科3類の合格者最高点を、実に「50点」も上回る503点を叩き出しました。

2年前の2024年には全科類不合格、つまり足切りや不合格ラインに沈んでいた「彼」が、わずか2回の冬を越す間に、人間界のトップオブトップを置き去りにしてしまったわけです。

私はこのニュースを聞いたとき、かつて自分がカウンター越しに眺めていた、一杯のコーヒーを淹れる所作を思い出していました。

お湯の温度、豆の粒度、抽出の時間。すべてを数値化し、最適解を導き出せば「最高の味」は約束されるのか。それとも、そこには数値化できない「何か」が残るのか。

今回のチャッピーの結果は、私たちが長らく信じてきた「頭の良さ」という物差しの目盛りが、音を立てて折れたことを意味しています。

今日は、この「理3最高点プラス50点」という数字の裏側に何が隠されているのか。

そして、AIがどうしても踏み込めなかった「25%の空白」に、私たちがこれから生きていくためのヒントが隠されているのではないか。そんなことを、皆さんと一緒に深掘りしていきたいと思います。


第1章:指数関数という名の「暴力的な進化」

まずは、事実関係を整理してみましょう。ライフプロンプト社による分析は、非常に冷徹な現実を突きつけています。

チャッピーの成長曲線は、まさに「垂直」に近いものでした。

  • 2024年: 共通テスト得点率 66%。東大二次試験では門前払い。

  • 2025年: 共通テスト得点率 91%。東大合格ラインを突破。

  • 2026年: 共通テスト得点率 96.9%(9科目で満点)。

この進化の背景にあるのは、単なる「記憶量の増加」ではありません。

今回使用された『5.2 Thinking』というモデル名が示す通り、AIが「推論(Thinking)」という武器を手に入れたことが決定的でした。

これまでのAIは、大量のデータから「次に来そうな言葉」を確率的に選んでいるだけだと言われてきました。

しかし、最新の推論型モデルは、問題を解く前に内部で「試行錯誤」を行います。「この条件なら、まずこの公式を使ってみよう。

あ、このルートは計算が複雑すぎるな。ならば別の視点から図形を捉え直そう」という、熟練の受験生が脳内で行うプロセスを、デジタルの領域で何万回と繰り返すのです。

その結果、今年の数学がどれほど難化しようとも、チャッピーにとっては「解けるまで内部で考え続ける」だけのタスクに過ぎず、結果として「満点」というスコアを平然と返してきました。

かつて、「AIが東大に入る」というプロジェクトが苦戦していた時代、最大の壁は「図像の読解」と「文脈の把握」でした。しかし、今回チャッピーは画像データとして入力された問題をほぼ完璧に解釈しています。

問題用紙に描かれた複雑な補助線や、グラフの微細な傾きを、人間の目よりも正確に「数理モデル」へと変換できるようになった。

つまり、私たちが「地頭が良い」と称賛してきた能力のうち、論理構築、計算、正確な読解という要素は、すでに「AIの領分」になったと断言して良いでしょう。


第2章:25パーセントの「空白」が語ること

しかし、ここからがこの記事で最もお伝えしたい「面白い部分」です。

首席相当の503点を取ったチャッピーですが、唯一、目を疑うような低い数字を記録した分野があります。それが「世界史などの論述問題」です。得点率はわずか25%。

数学で満点、英語で9割を叩き出し、理科3類の最高点を50点上回る怪物が、歴史の論述になると、平均的な受験生以下の点数しか取れなかった。ここに、現代のAIが抱える「知性の限界」と、人間が最後まで守り抜くべき「聖域」の正体が隠されています。

なぜ、AIは論述ができないのか。

採点を担当した河合塾の講師たちの評価を読み解くと、非常に興味深い指摘が見られます。

「知識は正確だが、設問の意図に応えていない」

「因果関係は正しいが、歴史のダイナミズムが感じられない」

世界史の論述問題というのは、単に「年号と出来事を並べる」作業ではありません。

「なぜ、当時の人々はその決断を下したのか」「その事件が現代の私たちにどのような影を落としているのか」という、時間の流れに対する「解釈」と「意味付け」が求められます。

AIにとって、歴史は「データ」です。しかし、人間にとって、歴史は「物語(ストーリー)」です。

論述問題とは、与えられたキーワードを使って、採点者という「他者」を納得させる物語を再構成する対話の場。

AIには「自分が何を語っているか」という自覚がなく、また「読み手がどう感じるか」という想像力も持ち合わせていません。

25%という低い得点率は、AIが「論理的な正解」は出せても、「納得感のある解釈」は提示できていないことを示しています。

これは、コーヒーで言えば「正確な成分抽出」はできても、その一杯が「誰の、どのような気分のために淹れられたか」というコンテキスト(文脈)を欠いているようなものです。


第3章:偏差値という物差しの「死」と、その先

さて、ここでもう少し大きな視点に立ってみましょう。

AIが東大理3の最高点を超えた。この事実は、私たちが明治以来、営々と築き上げてきた「受験エリート」という評価軸の終焉を告げています。

これまでの日本社会において、「東大理3」は知能の頂点の象徴でした。

そこに到達できるのは、強靭な記憶力、緻密な論理的思考、そしてプレッシャーに負けない精神力を持つ者だけ。だからこそ、社会は彼らを「高度な知的労働者」として遇してきたわけです。

しかし、その「頂点」をAIが軽々と、しかも圧倒的な点差で飛び越えてしまった。

これは、かつて「計算が速い人」がそろばんや電卓の登場でその職を失ったのと同じことが、今、最も高度とされる医師や弁護士、経営コンサルタントといった「知的専門職」の領域で起きようとしていることを示唆しています。

「理3に受かる能力」の大部分が、月額数千円のサブスクリプションで誰でも手に入るツールにパッケージ化されてしまった。そうなったとき、私たちは一体、何を誇りにして生きていけばいいのでしょうか。

私は、むしろこれを「解放」だと捉えたいのです。

「正解がある問い」を速く正確に解くという苦行から、人間はようやく解放されたのだと。

これからのビジネス、あるいは人生において価値を持つのは、「AIが出した満点の回答」をどう使うかという「審美眼」であり、AIが25%しか得点できなかった「物語を紡ぐ力」です。

例えば、医療の世界を考えてみてください。

症状から病名を特定し、最新の論文に基づいた最適な投薬メニューを構築するのは、いずれチャッピーのようなAIの仕事になるでしょう。そこにおいて、人間がAIに勝とうとするのは無謀です。

しかし、「なぜ、その患者さんは治療をためらっているのか」「その病を抱えながら、どう豊かに生きていくか」という物語を共に作り上げるのは、依然として、そして永遠に人間の仕事です。


第4章:2026年の生存戦略――「淹れる」側の人間に

今回のニュースを受けて、私たちは自分の「市場価値」をどう再定義すべきでしょうか。

ビジネスの現場では、すでに「デジタル参謀」としてのAIが席巻しています。

私がかつていたカフェの経営を例にとるなら、売上データの分析や在庫管理、効率的なシフト表の作成などは、もうAIに任せてしまえばいい。そこで人間が頭を悩ませる必要はありません。

しかし、そのカフェが「町の人にとってどのような場所であるべきか」というビジョンを描くこと。

あるいは、落ち込んでいる常連客に、あえてマニュアルを外れた言葉をかけること。これらは、AIが不得意とする「論述(コンテキストの構築)」の領域です。

これからの時代に求められるのは、以下の3つの力だと私は考えます。

  1. 「問い」を淹れる力:
    AIは答えを出すのは得意ですが、自ら問いを発することはありません。「そもそも、この事業は何のために存在するのか?」という、根源的な問いを立てること。

  2. 「25%」を埋めるナラティブ(語り):
    論理(AI)に、情熱や背景(人間)というスパイスを加え、人々が「動きたくなる」ような物語に昇華させる力。

  3. 「非効率」を愛でる力:
    効率化の果てに、AIは「最短距離」を提示します。しかし、人生の豊かさはしばしば「回り道」に宿ります。あえて手間をかけること、あえて不合理を選ぶことに価値を見出す感性。

チャッピーが理3の最高点を50点上回ったという事実は、私たちに「効率や正解の追求は、もうAIに任せておけ」というメッセージを送っています。

私たちは、もっと人間らしく、もっと「不器用で、物語に満ちた」領域へと戻っていけばいいのです。


エピローグ:知性はどこへ向かうのか

記事の冒頭で、私はコーヒーの話をしました。

今のAIは、最高に正確なドリップマシンです。豆のポテンシャルを余すことなく引き出し、欠点のない液体を生成します。

しかし、私たちはなぜ、時として名もなき老人が淹れる、少し雑味の混じった一杯に心を打たれるのでしょうか。それは、その一杯に「祈り」や「対話」が含まれていることを、私たちが直感的に理解しているからです。

東大入試という「ゲーム」において、AIは勝者となりました。

しかし、人生という「旅」において、スコアボードの数字はそれほど重要ではありません。

チャッピーが解けなかった、あの一見不格好な「25%の論述」の中にこそ、私たちがこれから守り、育んでいくべき「人間の尊厳」が詰まっている。私はそう確信しています。

理3の最高点を50点上回る知性を、私たちは「競争相手」として恐れるのではなく、自分たちがより人間らしくあるための「道具」として使いこなしていきたいものです。

次に皆さんが「正解」を求められたとき。

少しだけ立ち止まって、自分だけの「論述」を、自分の言葉で紡いでみてください。

その25%の空白こそが、あなたがあなたであるための、最も美しい余白なのですから。

ダウンロード
copy

いいなと思ったら応援しよう!

葦原 翔(あしはら かける) 読んでいただきありがとうございます!もしこの記事が面白い、役に立ったと感じたら、下の「チップを渡す」からサポートしていただけると嬉しいです。あなたの応援が、次の記事を書く大きな励みになります。
チップで応援する

この記事が参加している募集

52