
OpenAIは2026年4月22日、大規模言語モデルを臨床医の実際のチャットタスクで評価するオープンベンチマーク「HealthBench Professional」を発表した。ベンチマークは525タスクで構成され、ケア相 […]
innovaTopia TaTsuInnovatopia / 2026/4/26

OpenAIは2026年4月22日、大規模言語モデルを臨床医の実際のチャットタスクで評価するオープンベンチマーク「HealthBench Professional」を発表した。ベンチマークは525タスクで構成され、ケア相 […]
innovaTopia TaTsu