OpenHospital: LLMベースの集合知を進化させ、ベンチマークするための“物自体”アリーナ

arXiv cs.AI / 2026/3/17

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

OpenHospital は、LLMベースの集合知を進化させ、ベンチマークするための対話型アリーナを提供し、CI研究におけるデータの壁を克服することを目指します。
医師エージェントと患者エージェントが相互作用する「データ・イン・エージェント・セルフ」パラダイムを採用し、協働ダイナミクスを通じてエージェントの能力を迅速に高めます。
本プラットフォームは、LLMベースの集合知における医療の熟練度とシステム効率の両方を評価するための堅牢な評価指標を提供します。
実験結果は、OpenHospital が集合知を促進し、医療・医師の文脈におけるその性能を定量化できることを示しています。

要旨：大規模言語モデル（LLM）に基づく集合知能（CI）は、データの壁を克服し、LLMエージェントの能力を継続的に高める有望なアプローチを提示します。しかし、現在、LLMベースのCIを進化させ、ベンチマークするための専用アリーナはありません。このギャップを埋めるために、OpenHospitalを導入します。医師エージェントが患者エージェントと相互作用することでCIを進化させるインタラクティブなアリーナです。このアリーナは、データをエージェント自身の内部に取り込むデータ・イン・エージェント・セルフ・パラダイムを採用しており、エージェントの能力を迅速に高め、医療熟練度とシステム効率の両方をベンチマークする堅牢な評価指標を提供します。実験は、CIの育成と定量化の両方におけるOpenHospitalの有効性を示しています。

[R] アイデンティティ・アンカーと権限階層の組み合わせが abliterated LLMs で 100% の拒否を実現 — システムプロンプトのみ、ファインチューニングなし

Reddit r/MachineLearning

私がリードを見つけ、個別化されたコールドメールを作成するAI SDRエージェントを構築した方法

Dev.to

完全ガイド: AIでお金を稼ぐ方法

Dev.to

AIでポートフォリオを分析して53/100を取得 — どうやって85点以上に改善したか

Dev.to

脱メチル化

Dev.to

OpenHospital: LLMベースの集合知を進化させ、ベンチマークするための“物自体”アリーナ

要点

関連記事

[R] アイデンティティ・アンカーと権限階層の組み合わせが abliterated LLMs で 100% の拒否を実現 — システムプロンプトのみ、ファインチューニングなし

私がリードを見つけ、個別化されたコールドメールを作成するAI SDRエージェントを構築した方法

完全ガイド: AIでお金を稼ぐ方法

AIでポートフォリオを分析して53/100を取得 — どうやって85点以上に改善したか

脱メチル化

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer