CANVAS:視覚エージェントによる絵コンテ作成を介した、連続性を意識したナラティブ

arXiv cs.CL / 2026/4/16

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、ショット間の連続性を明示的に計画する長編ビジュアルストーリーテリングのためのマルチエージェントフレームワーク「CANVAS」を提案する。
  • CANVASは、キャラクターの連続性の強制、持続的な背景アンカーの利用、ロケーションに応じたシーン計画の実行により、生成モデルで一般的に起こり得る失敗を抑えることを目的としている。これにより、突然の遷移を減らす。
  • 著者らは、既存の絵コンテベンチマークST-BENCHおよびViStoryBenchでCANVASを評価し、さらに長距離にわたる物語の一貫性に焦点を当てた新しい、より難易度の高いベンチマーク「HardContinuityBench」を提案する。
  • 結果として、CANVASは最強のベースラインを上回り、背景の連続性で21.6%、キャラクターの一貫性で9.6%、小道具の一貫性で7.6%の改善が報告されている。