World2Minecraft:占有(Occupancy)駆動型のシミュレートシーン構築
arXiv cs.CV / 2026/5/1
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- この論文は、3Dセマンティック占有予測を用いて現実のシーンを編集可能なMinecraft環境に変換するWorld2Minecraftという枠組みを提案し、知覚と意思決定を支える高精度なエンボディドAIシミュレーションを目指しています。
- 再構成されたMinecraftシーンは、Vision-Language Navigation(VLN)などの下流タスクにそのまま活用でき、エンボディド知能のワークフローをより再利用しやすくします。
- 著者らは、再構成品質が占有予測モデルの精度と汎化性能に強く依存しており、これは現状のデータ不足によって制約されていると指摘しています。
- 低コストで自動化・スケーラブルなデータ取得パイプラインにより、カスタマイズ可能な占有データセットを生成し、MinecraftOccを公開しています(全156の豊かな屋内シーンから画像100,165枚)。
- 実験では、MinecraftOccが既存データセットを補完するだけでなく、現在のSOTA手法にとって大きな挑戦となる新たなベンチマークを提供していることが示され、占有予測研究とエンボディドAI向けツールの価値を高めています。




