要旨:大規模言語モデル(LLM)に基づく集合知能(CI)は、データの壁を克服し、LLMエージェントの能力を継続的に高める有望なアプローチを提示します。しかし、現在、LLMベースのCIを進化させ、ベンチマークするための専用アリーナはありません。このギャップを埋めるために、OpenHospitalを導入します。医師エージェントが患者エージェントと相互作用することでCIを進化させるインタラクティブなアリーナです。このアリーナは、データをエージェント自身の内部に取り込むデータ・イン・エージェント・セルフ・パラダイムを採用しており、エージェントの能力を迅速に高め、医療熟練度とシステム効率の両方をベンチマークする堅牢な評価指標を提供します。実験は、CIの育成と定量化の両方におけるOpenHospitalの有効性を示しています。
OpenHospital: LLMベースの集合知を進化させ、ベンチマークするための“物自体”アリーナ
arXiv cs.AI / 2026/3/17
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- OpenHospital は、LLMベースの集合知を進化させ、ベンチマークするための対話型アリーナを提供し、CI研究におけるデータの壁を克服することを目指します。
- 医師エージェントと患者エージェントが相互作用する「データ・イン・エージェント・セルフ」パラダイムを採用し、協働ダイナミクスを通じてエージェントの能力を迅速に高めます。
- 本プラットフォームは、LLMベースの集合知における医療の熟練度とシステム効率の両方を評価するための堅牢な評価指標を提供します。
- 実験結果は、OpenHospital が集合知を促進し、医療・医師の文脈におけるその性能を定量化できることを示しています。