アンソロピックの新ベンチマークは「Claudeがバイオインフォマティクスで人間の専門家に匹敵できる」と主張

THE DECODER / 2026/4/30

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • アンソロピックは、Claudeが実世界のバイオインフォマティクス課題を専門家レベルで解けるかを検証するためのベンチマーク「BioMysteryBench」を公開した。
  • 報告された結果では、Claudeはこのベンチマーク上で人間の専門家に匹敵する性能に到達できることが示唆されている。
  • この記事は、結果が有望に見える一方で、主張を一般化するうえで重要な注意点(ケイブ)があると強調している。
  • 総じて、このベンチマークはClaudeの生物医学領域の専門的な問題解決能力を裏付ける材料として位置付けられているが、人間の専門家と同等であることを全面的に証明するものではない。

BioMysteryBenchで、Anthropicは、Claudeが専門家レベルで実際のバイオインフォマティクス課題を解けることを示したいと考えています。結果は有望ですが、重要な注意点も伴います。

この記事 Anthropic's new benchmark claims Claude can match human experts in bioinformaticsThe Decoder に初めて掲載されました。