AI Navigate

LLM支援によるMIP/MIPVU規則スクリプト生成を用いた解釈可能な中国語比喩識別:比較プロトコル研究

arXiv cs.CL / 2026/3/12

💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • 本論文は、四つの比喩識別プロトコル(MIP/MIPVU語彙分析、CMDAG概念マッピング注釈、感情ベース検出、比喩表現の識別)を実行可能で人間が監査可能な規則スクリプトとして、中国語の比喩識別のために実装するLLM支援のパイプラインを提示します。
  • 七つの中国語比喩データセットをトークンレベル、文レベル、スパンレベルのアノテーションにまたがって評価し、中国語比喩識別における初のクロスプロトコル比較を確立しました。
  • 結果は、プロトコルA(MIP)がトークンレベル識別でF1=0.472を達成し、クロスプロトコルのコーエンのカッパはAとD間で0.001と低く、BとC間で0.986と高いことを示し、プロトコル選択が変動の主要源であることを強調します。
  • 研究は、100%の決定論的再現性と解釈可能な出力(根拠の正確性0.40–0.87、編集可能性0.80–1.00)を報告しており、規則スクリプト・アーキテクチャが透明性を保ちつつ競争力を維持できることを示しています。
  • 本文: arXiv:2603.10784v1 アナウンス種別: new
要旨:比喩識別は比喩言語処理の基礎的な課題であるが、多くの計算的アプローチは不透明な分類器として機能し、表現がなぜ比喩的と判断されたのかを示す洞察を提供しない。この解釈性のギャップは中国語において特に深刻であり、豊かな比喩的伝統、形態的手掛かりの欠如、注釈資源の不足がこの課題をさらに複雑にする。我々は、四つの比喩識別プロトコル—MIP/MIPVU語彙分析、CMDAG概念マッピング注釈、感情ベース検出、比喩表現の識別—を、実行可能で人間が監査可能な規則スクリプトとして動作させるLLM支援パイプラインを提示する。各プロトコルは制御されたLLM呼び出しと組み合わされた決定的ステップのモジュール連鎖であり、分類決定ごとに構造化された根拠を生成する。私たちは、トークンレベル、文レベル、スパンレベルのアノテーションにまたがる七つの中国語比喩データセットを評価し、中国語比喩識別における初のクロスプロトコル比較を確立した。プロトコル内の評価では、プロトコルA(MIP)はトークンレベル識別でF1=0.472を達成し、クロスプロトコル分析ではAとDの間のコーエンのカッパは0.001と著しく乖離しており、BとCはほぼ完全な一致を示す(カッパ=0.986)。解釈性監査では、すべてのプロトコルが100%の決定論的再現性を達成し、根拠の正確性は0.40〜0.87、編集可能性は0.80〜1.00であることが示された。誤差分析では、概念ドメインの不一致と語用域感度が支配的な故障モードとして特定された。我々の結果は、比喩識別においてプロトコル選択が唯一の最大の変動源であることを示し、モデルレベルの変動を上回り、規則スクリプト・アーキテクチャが完全な透明性を保ちつつ競争力のある性能を達成することを示している。