BrickNet: Graph-Backed Generative Brick Assembly

arXiv cs.CV / 4/28/2026

📰 NewsModels & Research

Key Points

  • BrickNetは、LEGOブロックの組み立て手順(ビルドシーケンス)を生成する言語モデルを訓練する研究で、従来よりもはるかに多様な部品と接続意味論を扱います。
  • 100,000件超の人手設計のLDrawブリックオブジェクトとシーンから大規模データセットを構築し、幅広い部品タイプ(数千種類)に対応できるようにしています。
  • 3D上での部品配置だけでなく、部品同士の「空間関係=接続関係」を本質として捉え、直接ポーズを逐次予測する場合に起きる手順の早期破綻を、グラフベースのプログラム表現で改善します。
  • 物理的に成立しやすい生成シーケンスを目指し、将来の研究用途にデータセットとモデルを公開する計画(研究目的での提供)を示しています。

Abstract

We train a language model to generate LEGO-brick build sequences. While prior work has been restricted to discrete, voxel-like towers, we consider a much broader set of pieces, encompassing thousands of part types with diverse connection semantics. To enable this, we first collect a large-scale dataset of over 100,000 human-designed LDraw brick objects and scenes. The complexity of our setting makes it challenging to autoregressively assemble structures that satisfy physical constraints. When predicting block pose directly, build sequences quickly become invalid after a small number of steps. Although pieces are placed in 3D space, it is the spatial relationships of the parts which define the whole. With this in mind, we design a graph-based program representation that parametrizes structure through connectivity, improving the physical grounding of generated sequences. To enable future applications, we make our dataset and models available for research purposes. https://kulits.github.io/BrickNet