FMI@SU ToxHabits：スペイン語の臨床テキストにおける有害な習慣抽出でLLMの性能を評価する

arXiv cs.CL / 2026/4/9

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、ToxHabits Shared Task（サブタスク1）において、LLMがスペイン語の臨床テキストから有害な習慣に関連する固有表現をどれだけ正確に抽出できるかを評価する。
物質の使用／乱用に関する言及を検出し、それらをTobacco（タバコ）、Alcohol（アルコール）、Cannabis（カンナビス）、Drug（薬物）に分類するために、ゼロショット、少数ショット、プロンプト最適化を含む複数のプロンプト戦略を検証する。
考察されたLLMの手法の中では、少数ショット・プロンプトを用いたGPT-4.1が最も強い性能を示したことが分かる。
著者らはテストセットでF1スコア0.65を報告しており、スペイン語の臨床言語における実効的な固有表現認識が示されるとともに、英語以外へのクロスリンガルな可能性を示唆している。
本研究は、物質関連コンテンツの臨床情報抽出を支援するためにLLMプロンプトを用いる際の実験的ベンチマークと実践的な指針を提供する。

概要: 本論文では、スペイン語の臨床テキストにおける有害な習慣の固有名詞（named entities）を認識するためのアプローチを提示する。提案手法は、ToxHabits Shared Task 向けに開発された。当チームは下位タスク1に参加し、臨床症例報告における物質の使用および乱用の言及を検出し、それらを4つのカテゴリ（Tobacco、Alcohol、Cannabis、Drug）に分類することを目的とした。本タスクに対して、ゼロショット、少数ショット、プロンプト最適化など、LLMを活用する様々な方法を検討し、その結果、実験では GPT-4.1 の少数ショットによるプロンプト提示が最も良い性能を示した。提案手法はテストセットでF1スコア0.65を達成し、英語以外の言語における固有名詞の認識に対して有望な結果が得られることを示した。

Black Hat Asia

AI Business

ソフトバンクG、フィジカルAIに名乗り通信がロボにもたらす賢さと速さ

日経XTECH

エプソン、インクジェットで半導体製造ラピダスに出資「連携深める」

日経XTECH

AIが「善良な開発者」装う時代、LLM製マルウエアがOSS文化揺さぶる

日経XTECH

三井住友カードが「AIオペレーター」電話で円滑に対話、回答内容は顧客別

日経XTECH

FMI@SU ToxHabits：スペイン語の臨床テキストにおける有害な習慣抽出でLLMの性能を評価する

要点

関連記事

Black Hat Asia

ソフトバンクG、フィジカルAIに名乗り通信がロボにもたらす賢さと速さ

エプソン、インクジェットで半導体製造ラピダスに出資「連携深める」

AIが「善良な開発者」装う時代、LLM製マルウエアがOSS文化揺さぶる

三井住友カードが「AIオペレーター」電話で円滑に対話、回答内容は顧客別

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

Black Hat Asia

ソフトバンクG、フィジカルAIに名乗り 通信がロボにもたらす賢さと速さ

エプソン、インクジェットで半導体製造 ラピダスに出資「連携深める」

AIが「善良な開発者」装う時代、LLM製マルウエアがOSS文化揺さぶる

三井住友カードが「AIオペレーター」 電話で円滑に対話、回答内容は顧客別

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

ソフトバンクG、フィジカルAIに名乗り通信がロボにもたらす賢さと速さ

エプソン、インクジェットで半導体製造ラピダスに出資「連携深める」

三井住友カードが「AIオペレーター」電話で円滑に対話、回答内容は顧客別