テキストを通じたがんの追跡：オープンソース大規模言語モデルを用いた放射線レポートからの縦断的抽出

arXiv cs.CL / 2026/3/11

Tools & Practical UsageModels & Research

原文を読む →

共有:

要点

本論文では、大規模言語モデルを用いて非構造化放射線レポートから縦断的ながん関連データを抽出する、オープンソースかつローカル展開可能なパイプラインを紹介します。
本システムはllm_extractinatorフレームワーク内のqwen2.5-72bモデルを活用し、RECIST指針に従い複数時点にわたる病変データの抽出とリンクを行います。
オランダ語の胸部/腹部CTレポート50組での評価では、ターゲット病変、非ターゲット病変、新規病変属性の抽出においていずれも93％以上の高精度を示しました。
本手法はプロプライエタリモデルを用いないためプライバシー問題に対応し、構造化された臨床縦断データ抽出の再現性とスケーラビリティをサポートします。
結果は、オープンソースのLLMが腫瘍モニタリングなどの臨床テキスト処理に有効なツールとなりうることを示唆しています。

コンピュータ科学 > 計算と言語

arXiv:2603.09638 (cs)

[2026年3月10日に投稿]

題目:Tracking Cancer Through Text: Longitudinal Extraction From Radiology Reports Using Open-Source Large Language Models

著者:Luc Builtjes, Alessa Hering

Tracking Cancer Through Text: Longitudinal Extraction From Radiology Reports Using Open-Source Large Language Models という題目の論文（Luc Builtjes および他1名の著者による）のPDFを表示します

PDFを表示 HTML（実験的）

要旨:放射線科レポートは、腫瘍量、治療反応、疾患進行に関する重要な縦断（ロングチューディナル）情報を捉えるが、その非構造化された記述形式のために自動解析が困難になる。大規模言語モデル（LLM）は臨床テキスト処理を進歩させてきたものの、多くの最先端システムは商用（プロプライエタリ）であり、プライバシーに配慮したヘルスケア環境における適用可能性が制限される。本研究では、1m exttt{llm2} 12 12 12 12 12 12 12 12 1212 1212 12 12 12 12 12 12 12 12 12 1212 12 exttt{llm a} 12 12 12 12 12 12 12 1212 12 12 12 12 12 1212 12 12}12を用いて実装した、放射線科レポートからの縦断的情報抽出のための、完全にオープンソースでローカルにデプロイ可能なパイプラインを提示する。このシステムは、RECIST基準に従って、時間点間でターゲット病変、非ターゲット病変、新規病変のデータを抽出し、リンク付けするために 1m exttt{qwen2.5-72b} モデルを適用する。オランダのCT（胸部/腹部）レポートペア50組で評価したところ、高い抽出性能が得られ、属性レベルの正確度はターゲット病変で93.7%、非ターゲット病変で94.9%、新規病変で94.0%であった。このアプローチは、データプライバシーと再現性を確保しつつ、多時点の腫瘍学タスクにおいてオープンソースLLMが臨床的に意味のある性能を達成し得ることを示している。これらの結果は、日常の臨床テキストから構造化された縦断データを、大規模に抽出するためのローカルデプロイ可能なLLMの可能性を示唆している。

コメント:
対象:	計算と言語（cs.CL）
引用:	arXiv:2603.09638 [cs.CL]
	（または、この版については arXiv:2603.09638v1 [cs.CL]）
	https://doi.org/10.48550/arXiv.2603.09638 さらに詳しく学ぶためにここにフォーカス DataCite による arXiv 発行 DOI

投稿履歴

差出人: Luc Builtjes [メールを見る]
[v1] 2026年3月10日（火）13:13:43 UTC（1,529 KB）

全文リンク:

論文へのアクセス:

PDFを表示
HTML（実験的）
TeX ソース

ライセンスを見る

現在の閲覧コンテキスト:

cs.CL

< 前 | 次 >

新着 | 最近 | 2026-03

返却形式: {"translated": "翻訳されたHTML"}

ブラウズするには：

参考文献 & 引用

BibTeX引用をエクスポート読み込み中...

BibTeX形式の引用

データ提供元：

ブックマーク

書誌ツール

書誌および引用ツール

書誌エクスプローラーの切り替え

書誌エクスプローラー (エクスプローラーとは？)

Connected Papers の切り替え

Connected Papers (Connected Papers とは？)

Litmaps の切り替え

Litmaps (Litmaps とは？)

scite.ai の切り替え

scite Smart Citations (Smart Citations とは？)

コード、データ、メディア

この論文に関連付けられたコード、データ、メディア

alphaXiv の切り替え

alphaXiv (alphaXiv とは？)

コードへのリンクの切り替え

CatalyzeX 論文用コードファインダー (CatalyzeX とは？)

DagsHub の切り替え

DagsHub (DagsHub とは？)

GotitPub トグル

Gotit.pub (GotitPub とは何ですか？)

Huggingface トグル

Hugging Face (Huggingface とは何ですか？)

コードへのリンクトグル

Papers with Code (Papers with Code とは何ですか？)

ScienceCast トグル

ScienceCast (ScienceCast とは何ですか？)

デモ

Replicate トグル

Replicate (Replicate とは何ですか？)

Spaces トグル

Hugging Face Spaces (Spaces とは何ですか？)

Spaces トグル

TXYZ.AI (TXYZ.AI とは何ですか？)

レコメンダーと検索ツール

Influence Flower へのリンク

Influence Flower (Influence Flower とは何ですか？)

Core レコメンダートグル

CORE Recommender (CORE とは何ですか？)

著者
掲載先
所属機関
トピック

arXivLabs について

arXivLabs：コミュニティの共同協力者とともに行う実験的プロジェクト

arXivLabs は、共同協力者が当社の Web サイト上で直接新しい arXiv の機能を開発し、共有できるようにするためのフレームワークです。

arXivLabs に取り組む個人および組織の双方が、オープン性、コミュニティ、卓越性、ユーザーデータのプライバシーという当社の価値観を受け入れ、これらを支持してきました。arXiv はこれらの価値観に取り組んでおり、それらを遵守するパートナーとのみ連携します。

arXiv のコミュニティに価値をもたらすプロジェクトのアイデアはありますか？ arXivLabs についてもっと知る。

この論文のどの著者が賛同者ですか？ | MathJax を無効にする（MathJax とは何ですか？）

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

日経XTECH

Google Stitch「バイブデザイン」登場—自然言語でUIを作る時代へ

Innovatopia

LLMが数学の未解決問題を解いた日 — Epoch.ai FrontierMathと、人間とAIの協働が開く新しい研究スタイル

Qiita

PyTorchによる線形回帰のスクラッチ実装と理論設計