テキストを通じたがんの追跡:オープンソース大規模言語モデルを用いた放射線レポートからの縦断的抽出

arXiv cs.CL / 2026/3/11

Tools & Practical UsageModels & Research

要点

  • 本論文では、大規模言語モデルを用いて非構造化放射線レポートから縦断的ながん関連データを抽出する、オープンソースかつローカル展開可能なパイプラインを紹介します。
  • 本システムはllm_extractinatorフレームワーク内のqwen2.5-72bモデルを活用し、RECIST指針に従い複数時点にわたる病変データの抽出とリンクを行います。
  • オランダ語の胸部/腹部CTレポート50組での評価では、ターゲット病変、非ターゲット病変、新規病変属性の抽出においていずれも93%以上の高精度を示しました。
  • 本手法はプロプライエタリモデルを用いないためプライバシー問題に対応し、構造化された臨床縦断データ抽出の再現性とスケーラビリティをサポートします。
  • 結果は、オープンソースのLLMが腫瘍モニタリングなどの臨床テキスト処理に有効なツールとなりうることを示唆しています。

コンピュータ科学 > 計算と言語

arXiv:2603.09638 (cs)
[2026年3月10日に投稿]

題目:Tracking Cancer Through Text: Longitudinal Extraction From Radiology Reports Using Open-Source Large Language Models

Tracking Cancer Through Text: Longitudinal Extraction From Radiology Reports Using Open-Source Large Language Models という題目の論文(Luc Builtjes および他1名の著者による)のPDFを表示します
PDFを表示 HTML(実験的)
要旨:放射線科レポートは、腫瘍量、治療反応、疾患進行に関する重要な縦断(ロングチューディナル)情報を捉えるが、その非構造化された記述形式のために自動解析が困難になる。大規模言語モデル(LLM)は臨床テキスト処理を進歩させてきたものの、多くの最先端システムは商用(プロプライエタリ)であり、プライバシーに配慮したヘルスケア環境における適用可能性が制限される。本研究では、1m exttt{llm2} 12 12 12 12 12 12 12 12 1212 1212 12 12 12 12 12 12 12 12 12 1212 12 exttt{llm a} 12 12 12 12 12 12 12 1212 12 12 12 12 12 1212 12 12}12を用いて実装した、放射線科レポートからの縦断的情報抽出のための、完全にオープンソースでローカルにデプロイ可能なパイプラインを提示する。このシステムは、RECIST基準に従って、時間点間でターゲット病変、非ターゲット病変、新規病変のデータを抽出し、リンク付けするために 1m exttt{qwen2.5-72b} モデルを適用する。オランダのCT(胸部/腹部)レポートペア50組で評価したところ、高い抽出性能が得られ、属性レベルの正確度はターゲット病変で93.7%、非ターゲット病変で94.9%、新規病変で94.0%であった。このアプローチは、データプライバシーと再現性を確保しつつ、多時点の腫瘍学タスクにおいてオープンソースLLMが臨床的に意味のある性能を達成し得ることを示している。これらの結果は、日常の臨床テキストから構造化された縦断データを、大規模に抽出するためのローカルデプロイ可能なLLMの可能性を示唆している。
コメント:
対象: 計算と言語(cs.CL)
引用: arXiv:2603.09638 [cs.CL]
  (または、この版については arXiv:2603.09638v1 [cs.CL]
  https://doi.org/10.48550/arXiv.2603.09638
さらに詳しく学ぶためにここにフォーカス
DataCite による arXiv 発行 DOI

投稿履歴

差出人: Luc Builtjes [メールを見る]
[v1] 2026年3月10日(火)13:13:43 UTC(1,529 KB)
全文リンク:

論文へのアクセス:

    Tracking Cancer Through Text: Longitudinal Extraction From Radiology Reports Using Open-Source Large Language Models という題目の論文(Luc Builtjes および他1名の著者による)のPDFを表示します
  • PDFを表示
  • HTML(実験的)
  • TeX ソース
現在の閲覧コンテキスト:
cs.CL
< 前   |   次 >
返却形式: {"translated": "翻訳されたHTML"}
ブラウズするには:
cs
BibTeX引用をエクスポート 読み込み中...

BibTeX形式の引用

×
データ提供元:

ブックマーク

BibSonomy ロゴ Reddit ロゴ
書誌ツール

書誌および引用ツール

書誌エクスプローラーの切り替え
書誌エクスプローラー (エクスプローラーとは?)
Connected Papers の切り替え
Connected Papers (Connected Papers とは?)
Litmaps の切り替え
Litmaps (Litmaps とは?)
scite.ai の切り替え
scite Smart Citations (Smart Citations とは?)
コード、データ、メディア

この論文に関連付けられたコード、データ、メディア

alphaXiv の切り替え
alphaXiv (alphaXiv とは?)
コードへのリンクの切り替え
CatalyzeX 論文用コードファインダー (CatalyzeX とは?)
DagsHub の切り替え
DagsHub (DagsHub とは?)
GotitPub トグル
Huggingface トグル
コードへのリンク トグル
ScienceCast トグル
デモ

デモ

Replicate トグル
Spaces トグル
Hugging Face Spaces (Spaces とは何ですか?)
Spaces トグル
関連論文

レコメンダーと検索ツール

Influence Flower へのリンク
Core レコメンダー トグル
CORE Recommender (CORE とは何ですか?)
arXivLabs について

arXivLabs:コミュニティの共同協力者とともに行う実験的プロジェクト

arXivLabs は、共同協力者が当社の Web サイト上で直接新しい arXiv の機能を開発し、共有できるようにするためのフレームワークです。

arXivLabs に取り組む個人および組織の双方が、オープン性、コミュニティ、卓越性、ユーザーデータのプライバシーという当社の価値観を受け入れ、これらを支持してきました。arXiv はこれらの価値観に取り組んでおり、それらを遵守するパートナーとのみ連携します。

arXiv のコミュニティに価値をもたらすプロジェクトのアイデアはありますか? arXivLabs についてもっと知る