Retrieval-Reasoning Large Language Modelベースの合成臨床試験生成
arXiv cs.CL / 2026/3/27
💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- 本論文は、LLMを用いたfew-shot promptingにより、成功/失敗の2値アウトカムを持つ合成臨床試験レポートを生成するRetrieval-Reasoningフレームワークを提案する。
- 生成を関連するClinicalTrials.govデータに基づけるためのリトリーバル(検索)モジュールと、領域に整合した正当化(justification)を作り出す推論モジュールを組み合わせる。
- ClinicalTrials.govの実臨床試験データに関する実験により、合成試験が実データセットを効果的に補完できることが示される。
- 著者らは、合成データ、実データ、あるいはそれらの混合物を用いてBioBERT分類器を微調整し、ハイブリッドな微調整が臨床試験のアウトカム予測性能を改善することを見出す。
- 本研究は、LLMによって生成された合成試験が、臨床研究におけるプライバシーを保護しつつデータ拡張を支援し得ると論じ、あわせてGitHubでコードを公開している。
広告
![[Boost]](/_next/image?url=https%3A%2F%2Fmedia2.dev.to%2Fdynamic%2Fimage%2Fwidth%3D800%252Cheight%3D%252Cfit%3Dscale-down%252Cgravity%3Dauto%252Cformat%3Dauto%2Fhttps%253A%252F%252Fdev-to-uploads.s3.amazonaws.com%252Fuploads%252Fuser%252Fprofile_image%252F3618325%252F470cf6d0-e54c-4ddf-8d83-e3db9f829f2b.jpg&w=3840&q=75)



