テキストからCADへのための階層的かつ幾何学に配慮したグラフ表現の学習

arXiv cs.AI / 2026/4/14

💬 オピニオンSignals & Early TrendsModels & Research

要点

  • 本論文は、実行可能コードへ直接デコードするだけで組立(アセンブリ)の階層や幾何学的制約をモデル化しない既存システムの失敗モードに取り組むことで、テキストからCAD生成を対象とする。
  • 多層の部品・コンポーネントをノードとし、幾何学的制約をエッジとして表す階層的な幾何学に配慮したグラフの中間表現を導入し、探索空間と連鎖的な誤りを削減する。
  • 提案フレームワークでは、まず組立構造と制約を予測し、その後でアクション順序の条件付けと最終的なコード生成を行うことで、幾何学的忠実性と制約充足を向上させる。
  • 構造を意識した段階的(プログレッシブ)カリキュラム学習戦略を追加し、制御された構造編集と境界例の合成からなる段階的タスクによって、より頑健に学習できるようにする。
  • 著者らは、分解グラフ・アクション列・bpyコードを含む12K件の命令からCADへのデータセットを公開し、グラフおよび制約志向の評価指標を提示することで、既存手法に対して一貫した性能向上を報告している。

Abstract

テキストからCADへのコード生成は、テキストによる指示を、相互に依存し合う長い一連の操作へと変換する長期的な課題です。既存の手法は通常、アセンブリの階層構造や幾何学的制約を明示的にモデル化することなく、テキストをそのまま実行可能コード(例: bpy)へデコードします。これにより探索空間が拡大し、局所的な誤差が蓄積され、複雑なアセンブリでは連鎖的な失敗が起きることがしばしばあります。この問題に対処するために、中間表現として階層的かつ幾何学に配慮したグラフを提案します。このグラフは、多レベルの部品およびコンポーネントをノードとしてモデル化し、明示的な幾何学的制約をエッジとして符号化します。テキストを直接コードへ写像するのではなく、我々の枠組みはまず構造と制約を予測し、その後でアクションの順序付けとコード生成を条件付けることで、幾何学的な忠実性と制約充足性を改善します。さらに、構造に着目した段階的カリキュラム学習戦略を導入します。これは、制御された構造編集によって段階的な課題を構築し、モデルの能力の境界を探索し、反復学習のために境界例を合成します。加えて、指示、分解グラフ、アクション列、およびbpyコードからなる12Kのデータセットを構築し、グラフおよび制約指向の評価指標も併せて提供します。大規模な実験の結果、提案手法は幾何学的忠実性と幾何学的制約の正確な充足の両方において、一貫して既存手法を上回ることが示されています。