Camera Artist:映画的言語による物語的ストーリーテリングの映像生成のためのマルチエージェント・フレームワーク

arXiv cs.AI / 2026/4/13

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、「Camera Artist」というマルチエージェントの枠組みを提案し、単なる脚本からの映像生成ではなく、明示的な映画的言語を用いて物語的な映像シーケンスを生成することを目的とする。
  • 先行するマルチエージェントによる制作システムにおける重要なギャップとして、隣接するショット間での物語の進行を担保する仕組みを追加し、断片的なストーリーテリングを抑えることに取り組んでいる。
  • 専用の「Cinematography Shot Agent」が、ショット間の連続性を高めるためにストーリーボード生成を再帰的に行い、さらにショット設計をより表現力豊かにするための映画的言語の手がかりを注入する。
  • 著者らは、この手法が、物語の一貫性、動的な表現の豊かさ、知覚される映画品質に関する指標および評価において、既存のベースラインを上回ると報告している。
  • 全体として、本研究はエージェント型の映像生成を、計画(ストーリーボード)とスタイル/ショット制御(映画的言語の注入)を組み合わせた、実際の制作ワークフローにより近いものとして位置づけている。

要旨: 私たちは、現実世界の映画制作ワークフローをモデル化して、明示的な映画言語により物語性のある動画を生成するマルチエージェントフレームワークであるCamera Artistを提案します。近年のマルチエージェントシステムは、台本から動画への映画制作ワークフローの自動化において大きな進展を遂げてきましたが、隣接するショット間での物語の進行を構造化するための明示的な仕組みや、映画言語を意図的に用いる仕組みが欠けていることが多く、その結果、断片的なストーリーテリングや限られた映画的品質に至ります。これに対処するために、Camera Artistは既存のエージェント指向パイプラインを土台にし、ショット間の物語の連続性を強化するための再帰的な絵コンテ生成と、より表現力豊かで映画志向のショット設計を生み出すための映画言語の注入を統合する専用のCinematography Shot Agentを導入します。豊富な定量的および定性的結果により、本アプローチが物語の一貫性、ダイナミックな表現力、知覚される映画品質の各面で、既存のベースラインを一貫して上回ることが示されています。