LLMベースASRにおけるドメイン適応を効果的に行うための、限られた音声による発話—テキストギャップの解消

arXiv cs.CL / 2026/4/9

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、音声からLLMへの投影モジュールによって生じるモダリティギャップに対処しつつ、主にテキストのみのデータを用いて、LLMベースのエンドツーエンドASRモデルを適応させる方法を検討する。