AI Navigate

文書からスパンへ: LLMベースの ICD コード付与におけるコード中心学習

arXiv cs.CL / 2026/3/17

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、LLMを用いた ICD コード付与に対してコード中心の学習を提案し、教師信号を全臨床文書から短く、スケーラブルな証拠の断片へと移行させ、未知の ICD コードへの一般化を向上させる。
  • 訓練コストを削減しつつ、精度と解釈性を高める混合訓練戦略とコード中心のデータ拡張を導入する。
  • スパンレベル学習により、長大な臨床文書という課題に対処しつつ、LLMs が文書レベルの ICD コード付与を効率的に実行できるようにする。
  • 同じ LLM バックボーンの下で強力なベースラインを上回り、小規模な LLM が大規模な商用モデルと同等の性能を発揮できる。
  • 割り当てられたコードに対して明示的な証拠を付与することで、解釈性を保持する。

要旨: ICDコーディングは医療において重要である一方で、困難な課題です。最近、LLMベースの手法はICDコーディングにおける判別的手法よりも一般化能力が高いことを示しています。しかし、ICDコーディングのためのLLMのファインチューニングには3つの大きな課題があります。第一に、既存の公開ICDコーディングデータセットはICDコード空間のカバー範囲が限られており、未見のコードへ一般化するモデルの能力を制限します。第二に、素朴なファインチューニングはLLMの解釈可能性を低下させます。公開データセットの多くには割り当てられたコードを支持する明確な証拠が含まれていないためです。第三に、ICDコーディングは通常長い臨床文書を含むため、LLMのファインチューニングは計算コストが高くなります。これらの問題に対処するため、Code-Centric Learningを提案します。これは、監視情報を全臨床文書から、拡張性の高い短いエビデンスのスパンへ移行するトレーニングフレームワークです。このフレームワークの要点は、スパンレベルの学習がLLMが文書レベルのICDコーディングを実行する能力を向上させるということです。私たちの提案するフレームワークは、混合トレーニング戦略とコード中心のデータ拡張から成り、トレーニングコストを大幅に削減し、未見のICDコードの精度を向上させ、解釈可能性を維持します。同じLLMバックボーンの下で、私たちの手法は強力なベースラインを大きく上回ります。特に、私たちの手法は小規模なLLMでも、はるかに大きな独自モデルと同等の性能を達成できるようにし、その有効性と完全自動化されたICDコーディングの潜在能力を示しています。