AI Navigate

Chronos: 長期記憶のための構造化イベント検索を用いた時制対応の対話エージェント

arXiv cs.CL / 2026/3/18

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • Chronosは、対話を主語-動詞-目的語のイベントタプルへ分解し、解決済みの日時範囲とエンティティの別名を付与する時制対応のメモリーフレームワークを導入し、それらを構造化されたイベントカレンダーとターンカレンダーにインデックス化して、対話全体の文脈を保持する。
  • クエリ時には、Chronosは動的プロンプティングを適用して各質問に合わせた取得ガイダンスを生成し、エージェントに何を取得するか、時系列範囲をどのように絞り込むか、両方のカレンダーを横断する反復的なツール呼び出しループを通じてマルチホップ推論にどう取り組むかを指示する。
  • 本システムはLongMemEvalSにおいて8つのLLM全体で最先端の性能を達成し、Chronos Lowが92.60%、Chronos Highが95.60%の精度を達成し、従来の最高を7.67ポイント上回った。
  • アブレーションの結果は、イベントカレンダーが改善の58.9%に寄与する一方、他の構成要素は15.5%-22.3%の改善をもたらし、最も強力なモデル設定の下でもChronos Lowは従来のアプローチを上回っている。

Abstract

最近の大型言語モデル(LLMs)の進歩により、対話型AIエージェントは数週間または数か月にわたる長期の多ターン対話に関与できるようになりました。しかし、既存のメモリシステムは、月をまたいで進化する時系列に基づく事実や嗜好を推論するのが難しく、長い対話履歴に対するマルチホップ・時間依存クエリを効果的に取得する戦略を欠いています。我々はChronosを紹介します。Chronosは新しい時系列対応のメモリフレームワークで、生の対話を主語-動詞-目的語のイベントタプルに分解し、解決済みの日時範囲とエンティティの別名を付与し、それらを構造化されたイベントカレンダーにインデックス化します。これは、完全な対話文脈を保持するターンカレンダーと並べて格納されます。クエリ時にはChronosは動的プロンプティングを適用して各質問ごとに合わせた取得ガイダンスを生成し、何を取得するか、どの日時範囲でフィルタするか、そして両方のカレンダー上で反復的なツール呼び出しループを介してマルチホップ推論にどう取り組むかをエージェントに指示します。Chronosを、オープンソース・クローズドソースの8つのLLMを用いて、LongMemEvalSベンチマークの500問の質問からなる対話履歴タスクを6カテゴリにわたり評価します。Chronos Lowは92.60%の精度、Chronos Highは95.60%の精度を達成し、既存の最先端を7.67%上回る新たな記録を樹立しました。アブレーションの結果、イベントカレンダーがベースラインの改善に58.9%を占め、他のすべての構成要素は15.5%から22.3%の改善を生み出すことが示されました。特にChronos Low単独で、彼らの最も強力なモデル構成の下で評価された従来のアプローチを上回っています。