意味の進捗関数によるビデオ解析と生成
arXiv cs.CV / 2026/4/27
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文は、画像・ビデオ生成モデルにおいて意味が時間的に非線形に変化しやすく、内容がほとんど変わらない区間の後に急激な意味の飛躍が起きるという問題に取り組んでいます。
- 1次元の「Semantic Progress Function(意味の進捗関数)」を提案し、各フレームで意味埋め込み同士の距離を測って累積の変化を表す滑らかな曲線をフィットすることで、シーケンス上での意味の移り変わりをモデル化します。
- 意味の進捗曲線が直線から外れることは「意味のペース」が不均一であることを示し、生成ビデオにおける時間的な不規則性の診断や分析に活用できます。
- この洞察に基づき、意味の変化が一定速度で進むようにシーケンスの再パラメータ化(リタイミング)を行う「semantic linearization(意味の線形化)」手法を提案し、遷移の滑らかさと整合性を高めます。
- さらに、この枠組みはモデル非依存であるとして、異なる生成器間でのペース比較や、実データおよび生成データの両方を任意の目標ペースに誘導することができると述べています。



