要点

Stable Video 4D 2.0は、単一の動画から高忠実度の新規視点合成と4D生成を実現するアップグレードを導入します。
このアップデートは、最小限の入力から時系列的一貫性を保つ複数視点の表現を実現し、AI主導の動画制作の能力を拡張します。
このリリースは、入力要件を減らすことで新しいビジュアルエフェクトのワークフローを可能にし、メディア、エンターテインメント、製品ビジュアライゼーション全体のコンテンツ制作のワークフローに影響を及ぼす可能性があります。
この記事では、Stable Video 4D 2.0を採用する実務者と開発者への影響について、潜在的な利用ケース、パフォーマンスの考慮事項、および影響を検討しています。

Stable Video 4D 2.0: 高忠実度の新規ビューと単一動画からの4D生成のアップグレード

May 20

要点：

Stable Video Diffusion 4D（SV4D）を Stable Video 4D 2.0（SV4D 2.0）へアップグレードし、実世界の動画に対してより高品質な出力を提供します。
私たちの分析によれば、SV4D 2.0 は 4D ジェネレーションと新規視点の合成の両方で最先端の成果を達成します。
Stable Video 4D 2.0 は、寛容な Stability AI Community License の下で商用・非商用の利用が可能です。
マルチビュー生成モデルは Hugging Face からダウンロードでき、コードは GitHub、4D アセット再構成プロセスについては arXiv で読むことができます。

Stable Video 4D 2.0

私たちは Stable Video Diffusion 4D (SV4D) を Stable Video 4D 2.0 (SV4D 2.0) にアップグレードしました。実世界のビデオでより高品質な出力を提供します。このマルチビュー動画拡散モデルは、単一のオブジェクト中心のビデオから動的な4Dアセットを生成するのに最適です。これらのアップグレードは、プロの制作ワークフローのための動的な4Dアセットの作成を容易にします。ゲーム内キャラクターのスプライトシートの生成から、映画や仮想世界のアセットのサポートに至るまで。

未知の視点から3Dオブジェクトを視覚化する際の本質的な曖昧さのため、マルチビュー生成は依然として複雑です。被写体が動いている場合は、特に難しくなります。SV4D 2.0は、大規模なデータセットやマルチカメラ設定、前処理に頼らず、一貫した多角度出力を生成することで、この課題に対処するための段階的な進歩を遂げています。これが前進を意味する一方で、動的な動きでは時折アーティファクトが発生することがあります。

新機能

SV4D 2.0には、以下を含む複数のアップグレードを施しました：

より鮮明で一貫した4D出力: モデルは段階的に訓練され、静的な3Dアセットから開始し、動きを追加することで、より鮮明で一貫した4Dの結果を得られるようになりました。

参照ビュー不要: 単一のビデオから直接動作し、マルチビュー参照画像の必要性を排除します。
ネットワークアーキテクチャの再設計: 3Dアテンションを活用し、3Dの空間的および時間的特徴を統合するメカニズムで、参照ビューに依存せずに時空間の一貫性を改善します。
実世界一般化の改善: 実世界のビデオでより一貫した動作をします。合成データで訓練されている一方で、事前学習済みのビデオモデルから世界知識を保持しています。

研究とベンチマーク

私たちの分析によれば、SV4D 2.0は4D生成において最先端の成果を達成しています。LPIPS（画像忠実度）、FVD-V（マルチビュー一貫性）、FVD-F（時間的整合性）、FV4D（4Dの一貫性）の主要なベンチマークすべてで1位にランクされています。DreamGaussian4D、L4GM、SV4Dと比較して、このバージョンはよりシャープで一貫した4D出力を生成します。

私たちの分析は、SV4D 2.0が新規ビュー合成において Diffusion^2、SV3D、SV4D を上回ることを示しています。モデルはマルチビューの一貫性（FVD-V）と時間的整合性（FVD-F）を大幅に改善し、視点の変化と時間の経過の両方で高品質な出力を維持します。モデルの技術的進歩の詳細については、研究論文をご覧ください。

$\"\"$

Getting started

Stable Video 4D 2.0 は、商用・非商用の用途に対して、寛容な Stability AI コミュニティライセンスの下で利用できます。

Hugging Face からダウンロードできます。コードは GitHub で見つけ、4D アセット再構成プロセスについては arXiv をご覧ください。

進捗を随時更新するために、X、 LinkedIn、 Instagram、および Discord Community にご参加ください。

ゲストユーザー

Stable Video 4D 2.0: 単一の動画からの高忠実度な新規視点と4D生成のアップグレード

要点

Stable Video 4D 2.0: 高忠実度の新規ビューと単一動画からの4D生成のアップグレード

要点：

Stable Video 4D 2.0

新機能

研究とベンチマーク

Getting started

関連記事

「Google AI Studio」がFirebaseのバックエンドとAntigravityのコーディングエージェントを搭載、プロンプトだけで高度なフルスタックアプリケーションを生成可能に

AIエージェントがコマンドラインでブラウザを自動操作できる「Browser Use CLI 2.0」リリース。Chrome DevToolsへの接続などで操作速度が2倍に

仕様駆動開発における自己改良エージェント

2026年版：AIでLinkedInプロフィールを最適化して採用担当者に見つけてもらう方法

Agentforce Builder: SalesforceでAIエージェントを構築する方法

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer