字形駆動による微調整で、古代中国文字の進化分析のためのマルチモーダル大規模言語モデルを強化する
arXiv cs.CL / 2026/4/14
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、古代中国文字の進化分析のための新しいマルチモーダルLLMベンチマークを導入し、11のタスクと130,000件以上のインスタンスを通じてモデルの能力を体系的に評価する。
- 主要な複数のMLLMに対する評価の結果、現行システムは字形レベルの比較能力が限定的であり、文字認識や進化的推論といった重要タスクでの性能が制約されていることが示される。
- これらのギャップに対処するため、著者らは、テキストの進化に関連する一貫した字形変換を学習するようモデルを誘導する字形駆動の微調整フレームワーク(GEVO)を提案する。
- 結果として、GEVOはベンチマークの全タスクにおいて性能向上をもたらし、比較的小規模な約2Bパラメータのモデルでも改善が得られることが示される。
- 著者らは、追試や追随研究を可能にするため、ベンチマークと学習済みモデルを公開する(GitHubリポジトリを提供)。




