500人の投資銀行家がAI出力を査読:顧客提出に「準備完了」と判定なし

THE DECODER / 2026/4/26

💬 オピニオンSignals & Early TrendsIndustry & Market MovesModels & Research

要点

  • ベンチマークでは、GPT-5.4やClaude Opus 4.6などの主要AIモデルを、若手投資銀行家が日常的に行う業務タスクにあてて評価しました。
  • レビューの結果、AIの出力は1件も顧客にそのまま提出できるレベルに達しておらず、不正確さや品質不足が理由でした。
  • それでも、銀行家の半数超はAI出力を仕事の「出発点」として使いたいと回答しました。
  • この結果は、金融の業務フローではAIが草案作成や発想の補助には有用でも、現時点では顧客提出基準に届いていないことを示唆しています。

表や図解のあるカラフルな金融書類の束の間に置かれた小さな机の上のノートパソコン。

新しいベンチマークでは、GPT-5.4やClaude Opus 4.6のようなトップモデルに、日々の業務としてジュニアの投資銀行員が扱う種類のタスクを実行させている。AIの出力は1つとして、クライアントに送信できる状態だと評価されなかった。結果があまりにも不正確か、あるいははっきりと間違っているからだ。それでも、半数を超える銀行員は、その出力を出発点として使うだろうと答えている。

この記事は500人の投資銀行員がAIの出力をレビューし、クライアント納品に適したものは1つもないと判明としてThe Decoderに最初に掲載された。