AI Navigate

大規模言語モデルによる時系列テキスト分類

arXiv cs.CL / 2026/3/13

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、3つの歴史的コーパス(英語2つ、ポルトガル語1つ)を横断して、主要な有償LLMs(Claude 3.5、GPT-4o、Gemini 1.5)およびオープンソースLLMs(LLaMA 3.2、Gemma 2、Mistral、Nemotron 4)を用いて、ゼロショット、少数ショットプロンプト、およびファインチューニング設定を評価する、時系列テキスト分類(TTC)の体系的評価を行います。
  • 有償モデルは、特に少数ショットプロンプトで強力なTTC性能を示します。
  • オープンソースモデルはファインチューニングにより性能が向上するものの、依然として有償LLMsの性能には及びません。
  • 本研究は、プロンプト設計、モデル選択、および歴史的文献の日付付与に関する今後の研究への示唆を提示します。
本文: arXiv:2603.11295v1 アナウンスメントタイプ: new 要旨: 言語は時間とともに変化します。計算モデルはこのような変化を認識するよう訓練することができ、テキストの出版日を推定することが可能になります。大型言語モデル(LLMs)の最近の進歩にもかかわらず、テキストの自動日付推定、通称 Temporal Text Classification(TTC)の性能は検討されてきませんでした。本研究は、主要な有償(Claude 3.5、GPT-4o、Gemini 1.5)およびオープンソース(LLaMA 3.2、Gemma 2、Mistral、Nemotron 4)のLLMsを対象に、英語2コーパスとポルトガル語1コーパスの計3つの歴史コーパスを用いてTTCを評価する初めての体系的評価を提供します。我々はゼロショットおよび少数ショットのプロンプト使用、およびファインチューニング設定をテストします。我々の結果は、有償モデルが良好な性能を示し、特に少数ショットのプロンプト使用時にそうであることを示します。また、ファインチューニングはオープンソースモデルを大幅に改善しますが、それらは依然として有償LLMsが提供する性能には及びません。