要旨: 臨床研究には、研究デザイン、コホート構築、モデル開発、ドキュメンテーションといった労働集約的なプロセスが含まれます。これには、専門知識、プログラミングスキル、機微な患者データへのアクセスが必要です。これらの要求は、データ駆動型の研究を行う臨床医や外部研究者にとって障壁となっています。こうした制約を克服するために、データのプライバシーを保ちながら、元データに直接アクセスすることなく包括的な研究を可能にする、臨床エージェント型研究インテリジェンスシステム(CARIS)を開発しました。CARISは、Model Context Protocol(MCP)を介してモジュール型ツールと大規模言語モデル(LLM)を統合し、自然言語による適切なツールのオーケストレーションを実現します。データベースはMCPサーバ内に安全に保持され、ユーザは出力と最終的な研究レポートのみを利用します。ユーザの意図に基づき、CARISは研究計画、文献検索、コホート構築、施設内審査委員会(IRB)ドキュメンテーション、Vibe Machine Learning(ML)、レポート生成からなる一連のパイプラインを自動的に実行し、反復的に人が介入することで改良します。相異なる臨床タスクをそれぞれ含む3つの異種データセットでCARISを評価しました。研究計画とIRB文書は、文献とデータに基づくエビデンスを用い、3〜4回の反復で確定しました。システムは、特徴量とモデルの組み合わせを探索し、上位10モデルをランキングし、性能の可視化を生成することでVibe MLを支援しました。最終レポートは、TRIPOD+AIフレームワークから導出したチェックリストに基づく高い完全性を示し、LLM評価で96%、人手評価で82%のカバレッジを達成しました。CARISは、エージェント型AIが、異種データセット全体にわたって臨床の仮説を実行可能な研究ワークフローへと変換できることを示しています。コーディングや直接データアクセスの必要性をなくすことで、本システムは障壁を低減し、公的および私的な臨床データ環境を橋渡しします。
臨床エージェント型研究インテリジェンスシステムのための、コーディング不要かつプライバシー保護MCPフレームワーク
arXiv cs.CL / 2026/4/15
💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- 本論文は、主要な臨床研究プロセス(計画立案、文献検索、コホート構築、IRB文書作成、モデリング、レポート作成)をエージェント型ワークフローにより自動化する「コーディング不要」の臨床エージェント型研究インテリジェンスシステムCARISを提案する。
- CARISは、Model Context Protocol(MCP)を介してモジュール式ツールと統合された大規模言語モデル(LLM)を用いるため、ユーザがコードを書く必要はなく、自然言語による意図に基づいてオーケストレーションが駆動される。
- プライバシーは、臨床データベースをMCPサーバ内に保持し、導出された出力と最終的な研究レポートのみをユーザに公開することで保護され、生の機微データへの直接アクセスを回避する。
- 3つの異種の臨床データセットにまたがる評価では、CARISは研究計画とIRB文書を3〜4回の反復で確定し、特徴量−モデルの組合せを探索して上位10モデルをランキングし、性能の可視化を生成することでVibe MLを支援した。
- 生成されたレポートは、TRIPOD+AI由来のチェックリストにより高い完成度として評価され、LLM評価で96%のカバレッジ、人手評価で82%を達成した。




