AgenticAI-DialogGen:LLMの短期・長期メモリを微調整および評価するためのトピック誘導型会話生成

arXiv cs.CL / 2026/4/15

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、人間の監督を回避しつつ、ペルソナに根差したトピック誘導型ダイアログを生成する、モジュール型のエージェントベース・フレームワーク「AgenticAI-DialogGen」を提案する。
  • 知識グラフを抽出し、トピックを特定し、話者ごとのペルソナを構築し、会話間でのトピックの連続性をシミュレーションすることで、長期および短期のメモリ表現を構築する。
  • QAモジュールは、短期および長期の会話履歴の双方から出所する「メモリに根差した」質問–回答ペアを作成し、「メモリ」能力の評価を支援する。
  • 著者らは新しいデータセット「TopicGuidedChat(TGC)」を公開する。TGCでは、長期メモリを話者固有の知識グラフとして符号化し、短期メモリを新たに生成されたトピック誘導型会話として表現する。
  • 実験結果は、AgenticAI-DialogGenが会話の質を向上させること、またTGCでLLMを微調整することで、メモリに根差したQAタスクでの性能が向上することを示している。

要旨: 大規模言語モデル(LLM)の最近の進歩により、拡張された会話文脈を処理する能力は向上しています。しかし、短期・長期のメモリを微調整し評価することは、短期および長期の会話履歴の両方を符号化するデータセットが存在しないため、依然として困難です。既存の会話データセットは、メモリに基づく根拠を欠いている、話題の連続性を見落としている、または高コストな人手による注釈に依存している、といった課題があります。これらの不足を解消するために、人間の監督なしでペルソナに基づきつつ話題に誘導された会話を生成する、モジュール式のエージェントベースフレームワーク AgenticAI-DialogGen を提案します。このフレームワークは、LLMエージェントを用いて知識グラフを抽出し、トピックを特定し、話し手のペルソナを構築し、非構造化された会話から話題に誘導された会話をシミュレートします。QAモジュールは、短期および長期の会話履歴から導出されるメモリに根ざした質問応答(QA)ペアを生成します。また、話題に誘導された新しいデータセット TopicGuidedChat(TGC)も作成しました。ここでは、長期メモリは話し手固有の知識グラフとして符号化され、短期メモリは新たに生成された話題に誘導された会話として表されます。評価の結果、AgenticAI-DialogGen は会話の質をより高く生成でき、さらに TGC データセットで微調整された LLM は、メモリに根ざした QA タスクにおいて改善された性能を達成することが示されています。