Right at My Level:熟達度を考慮したテキスト簡略化のための統一的多言語フレームワーク

arXiv cs.CL / 2026/4/8

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、並列コーパスによる教師なしで、熟達度を考慮した適応的な多言語テキスト簡略化を実現する統一型強化学習フレームワーク「Re-RIGHT」を提案する。
  • その結果、CEFR/JLPT/TOPIK/HSKのような目標熟達度レベルを用いたプロンプトベースの語彙簡略化は、より易しい熟達度帯に対しては、また強力なLLMを用いても英語以外の言語では性能が低いことが分かった。
  • これを克服するために、著者らは英語・日本語・韓国語・中国語において、語彙レベルのデータ点を合計43K収集し、コンパクトな4Bのポリシーモデルを学習させる。
  • Re-RIGHTは、語彙カバレッジ、意味の保持、一貫性の3つの報酬モジュールを用いることで、意味と流暢さを維持しつつ、読みやすさの目標レベルをより適切に狙う。
  • 実験の結果、より強力なLLMベースラインと比較して、目標熟達度レベルにおける語彙カバレッジが向上し、かつ意味と流暢さの品質も維持されることが示された。