
OpenAIは2026年4月22日、大規模言語モデルを臨床医の実際のチャットタスクで評価するオープンベンチマーク「HealthBench Professional」を発表した。ベンチマークは525タスクで構成され、ケア相 […]
innovaTopia TaTsuInnovatopia / 4/26/2026

OpenAIは2026年4月22日、大規模言語モデルを臨床医の実際のチャットタスクで評価するオープンベンチマーク「HealthBench Professional」を発表した。ベンチマークは525タスクで構成され、ケア相 […]
innovaTopia TaTsu
AI Business
Dev.to

THE DECODER
Dev.to
Dev.to