PR-CAD:大規模言語モデルによる統一的な制御可能で忠実なテキストからCAD生成のための逐次洗練

arXiv cs.CL / 2026/4/23

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、テキストからCAD生成とCAD編集を統合する「PR-CAD」という逐次洗練フレームワークを提案し、実用性に向けた制御可能性と忠実性を高めます。
  • CADライフサイクル全体を対象にした高精度のインタラクション用データセットを構築し、編集操作の種類を体系的に定義しつつ、多様なCAD表現と定性的/定量的説明に基づく人間らしい操作データを生成します。
  • LLM向けに最適化したCAD表現と、強化学習を組み込んだ推論枠組みにより、意図理解・パラメータ推定・編集位置特定を1つのエージェントで同時に行います。
  • 実験および公開ベンチマークでは、PR-CADが生成と洗練の両シナリオで制御可能性と忠実性の最先端性能を示し、使いやすさとCADモデリング効率の向上にもつながることが示されています。

Abstract

CADモデルの構築は、伝統的に手作業による労働集約的な操作と専門的な知識に依存してきました。近年、大規模言語モデル(LLM)の進歩により、テキストからCADを生成する研究が刺激されました。しかし、既存のアプローチは一般に生成と編集を別個のタスクとして扱うため、その実用性が制限されています。そこで本研究では、制御可能で忠実なテキストからCADモデリングのために、生成と編集を統一する漸進的洗練フレームワークであるPR-CADを提案します。これを支えるために、CADのライフサイクル全体にわたる高忠実度なインタラクションデータセットを厳選します。このデータセットには、複数のCAD表現と、定性的および定量的な記述の両方が含まれています。データセットは編集操作の種類を体系的に定義し、非常に人間らしいインタラクションデータを生成します。LLM向けに調整されたCAD表現に基づき、意図理解、パラメータ推定、精密な編集位置特定を単一のエージェントに統合する、強化学習を強化した推論フレームワークを提案します。これにより、設計の作成と洗練の両方に対する「オールインワン」な解決策が可能になります。大規模な実験により、生成タスクと編集タスクの間、ならびに定性的・定量的なモダリティ間で強い相互強化が示されます。公開ベンチマークにおいてPR-CADは、生成および洗練の両シナリオで、制御可能性と忠実性の点で最先端の性能を達成し、さらにユーザーフレンドリーであり、CADモデリング効率も大幅に向上することを示します。