Tree-of-Text:スポーツ領域におけるテーブルから文章を生成するためのツリー型プロンプトフレームワーク

arXiv cs.AI / 2026/4/30

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • Tree-of-Textは、構造化されたテーブルからスポーツの試合レポートを生成するためのツリー構造のプロンプトフレームワークであり、データ解釈と文章生成の両方の難しさに対処します。
  • 生成は3段階でLLMを導きます:コンテンツ計画(テーブルから関連する操作と引数を選択)、操作実行(大きなテーブルを扱いやすいサブテーブルに分割)、コンテンツ生成(短い出力を統合して一貫したレポートに書き換えます)。
  • この手法は、プロンプトベースのテーブルから文章への生成で起きやすい、テーブル理解の弱さに起因する幻覚(ハルシネーション)を抑えることを狙っています。
  • 複数のスポーツ向けデータセットでの実験では、既存手法よりも良い結果が示されており、RotoWire-FGでRG/COが向上し、MLBではChain-of-Tableの約40%の時間とコストでCS/COが強化されました。
  • 全体として、段階的で構造化されたプロンプトが、スポーツ領域におけるテーブルから文章生成をより効果的かつ効率的にできることを示しています。

概要: 構造化された表からスポーツゲームのレポートを生成することは、正確なデータ解釈と流暢なナラティブ生成の両方を必要とする、複雑な表からテキストへのタスクです。従来のモデルベース手法では、大規模な注釈付きデータセットが必要になる一方、大規模言語モデル(LLM)を用いたプロンプトベース手法では、表の理解が弱いためにハルシネーションが起こりやすいことがよくあります。これらの課題を克服するために、本研究では Tree-of-Text を提案します。これは、LLM をツリー構造で導くプロンプトフレームワークであり、3 段階の生成プロセスを通じて LLM を誘導します:(1)コンテンツ計画。入力表から関連する操作と引数を選択します。(2)操作実行。大きな表を扱いやすいサブ表へ分解します。(3)コンテンツ生成。短いテキスト出力を統合し、まとまりのあるレポートとして書き換えます。実験の結果、提案手法は ShuttleSet+ において既存手法よりも優れ、RotoWire-FG では RG と CO の指標で先行し、MLB では Chain-of-Table の約 40% の時間とコストで CS と CO において優れています。これらの結果は、Tree-of-Text の有効性と効率性を示しており、スポーツ領域におけるプロンプトベースの表からテキスト生成に関して有望な方向性を示唆しています。