HealthBench Professional発表—ChatGPT for Cliniciansが医師を超えたスコアを記録、OpenAIの医療AI戦略が加速

Innovatopia / 4/26/2026

📰 NewsSignals & Early TrendsIndustry & Market MovesModels & Research

共有:

Key Points

OpenAIが、臨床医の実チャット業務を再現してLLMを評価するオープンベンチマーク「HealthBench Professional」を2026年4月22日に発表した。
ベンチマークは525タスクで構成され、医療領域での実務的な品質を測ることを目的としている。
「ChatGPT for Clinicians」が医師を上回るスコアを記録したことが示され、医療AIの実用性能が一段と進んだ可能性が示唆された。
医療AIの評価・導入に向けた基準整備が進み、OpenAIの医療AI戦略が加速している点が記事の主眼である。

2026年4月26日

OpenAIは2026年4月22日、大規模言語モデルを臨床医の実際のチャットタスクで評価するオープンベンチマーク「HealthBench Professional」を発表した。ベンチマークは525タスクで構成され、ケア相 […]

AI Business

Dev.to

THE DECODER

Dev.to

Dev.to