Multiverse: Language-Conditioned Multi-Game Level Blending via Shared Representation

arXiv cs.AI / 3/31/2026

📰 NewsSignals & Early TrendsIdeas & Deep AnalysisModels & Research

Key Points

  • Multiverseは、テキストで指定した内容をゲームのレベル構造へ変換する「言語条件付きテキストtoレベル生成」を複数ゲーム領域へ拡張する研究です。
  • 共有潜在空間を学習し、テキスト指示とレベル構造の対応をマルチゲームで揃えることで、ドメインをまたいだレベルのブレンディング(混成)を可能にします。
  • セマンティックに関連するレベル同士を、しきい値ベースのマルチポジティブ対照学習で結び付け、どの構造特性を保持して合成するかをテキストで制御できるようにします。
  • 潜在空間の補間による制御的ブレンディングや、複数コンポーネントから成るテキストプロンプトによるゼロショット生成ができることを主張しています。
  • 実験では、同一ジャンル内でのブレンディング品質向上と、マルチゲーム言語条件付き生成の統一表現としての有効性が示されたとしています。

Abstract

Text-to-level generation aims to translate natural language descriptions into structured game levels, enabling intuitive control over procedural content generation. While prior text-to-level generators are typically limited to a single game domain, extending language-conditioned generation to multiple games requires learning representations that capture structural relationships across domains. We propose Multiverse, a language-conditioned multi-game level generator that enables cross-game level blending through textual specifications. The model learns a shared latent space aligning textual instructions and level structures, while a threshold-based multi-positive contrastive supervision links semantically related levels across games. This representation allows language to guide which structural characteristics should be preserved when combining content from different games, enabling controllable blending through latent interpolation and zero-shot generation from compositional textual prompts. Experiments show that the learned representation supports controllable cross-game level blending and significantly improves blending quality within the same game genre, while providing a unified representation for language-conditioned multi-game content generation.