単一のプロットを超えて:複数チャートに対する質問応答のためのベンチマーク
arXiv cs.CL / 2026/4/24
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文では、複数の関連チャートをまとめて解釈する必要がある現実の状況をより反映するため、複数チャート画像の質問応答のベンチマークとしてPolyChartQAを提案しています。
- PolyChartQAには、2,297個のサブチャートを含む534個のマルチチャート画像と、査読付きコンピュータサイエンス研究論文から収集した2,694件の質問—回答ペアが含まれます。
- 著者らはPolyChartQAで最先端のマルチモーダル言語モデル9種を評価し、質問タイプ、難易度、質問の出所、そしてマルチチャートの構造的特性ごとに性能を分析しています。
- 結果として、LLMベースの精度が、人手で作成された質問ではモデル生成の質問より27.4%低下しており、人間らしいQAへの頑健性にギャップがあることを示しています。
- さらに、提案するプロンプト手法により精度が5.39%向上したと報告しており、プロンプト戦略が複数チャートQAの性能改善に有効である可能性を示唆しています。



