要旨: 本稿では、ボクセル解像度で表現されたMinecraftワールドの大規模データセット「Dream-Cubed」と、効率的にインタラクティブな3D環境を生成するために、キューブを強力な合成(コンポジショナル)単位として用いる一群のモデルを導入します。Dream-Cubed は、手続き的なバイオーム地形と高品質な人手によるマップを慎重に調合したものからなる、数百億トークン規模のデータで構成されています。本データセットを用いて、ボクセル生成のための3D拡散モデルに関する初の大規模研究を実施し、離散および連続の拡散定式化、データ構成、ならびにアーキテクチャ設計上の選択を分析します。提案モデルはブロック空間上で直接動作するため、効率的で意味に根ざした生成が可能であり、さらにユーザが作成したブロックからのインペインティングやアウトペインティングといった、インタラクティブなユーザの作業フローにも対応します。モデルを定量的に評価するために、FID 指標を適応して、実際のワールド描画と生成されたワールド描画の間に存在する意味の違いを評価し、人間の嗜好(好み)に基づく調査により生成品質を検証します。私たちは、データセット全体、コード、およびすべての事前学習済みモデルを公開します。これが、構造化されたインタラクティブな3D環境に対する効率的な生成モデリングに関する今後の研究の基盤となることを期待しています。
Dream-Cubed:Minecraftでのキューブ学習による制御可能な生成モデリング
arXiv cs.CV / 2026/4/28
📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research
要点
- 本論文では、Minecraftの巨大ボクセルデータセット「Dream-Cubed」と、生成時に「キューブ」を強力な合成単位として用いることでインタラクティブな3D環境を効率よく作る生成モデル群を提案しています。
- Dream-Cubedは、手作業で厳選したバイオーム地形のプロシージャル生成と、高品質な人間制作マップを組み合わせ、数十億トークン規模の学習データを構築しています。
- 著者らは、ボクセル生成に向けた3D拡散モデルの大規模研究として初の取り組みを行い、離散・連続の拡散定式化、データ構成、アーキテクチャ設計を比較・分析します。
- モデルはブロック空間で直接生成し、ユーザーが作成したブロックを条件にしたインペインティング(補完)やアウトペインティング(拡張)などの対話的ワークフローに対応します。
- 評価では、実データと生成データのワールド描画の意味的な差を測るためにFIDを適応し、人間の嗜好評価でも生成品質を検証し、さらにデータセット・コード・事前学習済みモデルを公開しています。



