FMI@SU ToxHabits:スペイン語の臨床テキストにおける有害な習慣抽出でLLMの性能を評価する

arXiv cs.CL / 2026/4/9

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、ToxHabits Shared Task(サブタスク1)において、LLMがスペイン語の臨床テキストから有害な習慣に関連する固有表現をどれだけ正確に抽出できるかを評価する。
  • 物質の使用/乱用に関する言及を検出し、それらをTobacco(タバコ)、Alcohol(アルコール)、Cannabis(カンナビス)、Drug(薬物)に分類するために、ゼロショット、少数ショット、プロンプト最適化を含む複数のプロンプト戦略を検証する。
  • 考察されたLLMの手法の中では、少数ショット・プロンプトを用いたGPT-4.1が最も強い性能を示したことが分かる。
  • 著者らはテストセットでF1スコア0.65を報告しており、スペイン語の臨床言語における実効的な固有表現認識が示されるとともに、英語以外へのクロスリンガルな可能性を示唆している。
  • 本研究は、物質関連コンテンツの臨床情報抽出を支援するためにLLMプロンプトを用いる際の実験的ベンチマークと実践的な指針を提供する。

概要: 本論文では、スペイン語の臨床テキストにおける有害な習慣の固有名詞(named entities)を認識するためのアプローチを提示する。提案手法は、ToxHabits Shared Task 向けに開発された。当チームは下位タスク1に参加し、臨床症例報告における物質の使用および乱用の言及を検出し、それらを4つのカテゴリ(Tobacco、Alcohol、Cannabis、Drug)に分類することを目的とした。本タスクに対して、ゼロショット、少数ショット、プロンプト最適化など、LLMを活用する様々な方法を検討し、その結果、実験では GPT-4.1 の少数ショットによるプロンプト提示が最も良い性能を示した。提案手法はテストセットでF1スコア0.65を達成し、英語以外の言語における固有名詞の認識に対して有望な結果が得られることを示した。