QFS-Composer：リソースの少ない言語向けのクエリ重視要約パイプライン

arXiv cs.CL / 2026/4/14

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

LLMは要約で高い性能を示すものの、ラベル付きデータや評価ツールが限られているリソースの少ない言語では、その品質が急激に低下します。
本論文は、クエリ重視の要約パイプラインであるQFS-Composerを提案します。具体的には、クエリ分解、質問生成、質問応答、抽象的要約を組み合わせることで、要約をユーザの意図により適切に整合させます。
低リソース環境での教師あり学習と評価を支援するため、著者らはスロベニア語のQAおよびQGモデルを、スロベニア語LLMから派生させて構築し、要約品質に対する参照なしの評価手法を適応します。
スロベニア語での実験により、QAに導かれたパイプラインは、ベースラインのLLM要約アプローチと比べて、一貫性と関連性が向上することが示されます。
本研究は、スロベニア語以外の、他のリソースの少ない言語に対してもクエリ重視要約を発展させることを目指した、拡張可能な手法論を提案します。

概要: 大規模言語モデル（LLM）はテキスト要約において強力な性能を示しますが、学習リソースが制限された状態では、その有効性が言語をまたいで大きく低下します。本研究は、ラベル付きデータセットや評価ツールが限られている、リソースの乏しい言語におけるクエリ重視要約（QFS）の課題に取り組みます。ユーザーの意図に対する要約の事実整合性を改善するために、クエリ分解、質問生成（QG）、質問応答（QA）、および抽象的要約を統合した新しいQFSフレームワークであるQFS-Composerを提案します。スロベニア語でアプローチを検証します。高品質な教師あり学習と評価を可能にするために、スロベニア語のQAおよびQGモデルをスロベニア語LLMに基づいて開発し、参照なし要約評価のための評価手法を適応します。実験的評価の結果、QAに導かれる要約パイプラインは、ベースラインのLLMよりも一貫性と関連性が向上することが示されました。本研究は、リソースの乏しい言語におけるQFSを前進させるための拡張可能な方法論を確立します。