CADSmith：プログラム的幾何検証によるマルチエージェントCAD生成

arXiv cs.AI / 2026/3/30

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

原文を読む →

共有:

要点

CADSmithは、自然言語からCadQueryコードを生成するマルチエージェントのテキストto-CADシステムであり、2つのネスト（入れ子）のリファインメントループによってコードを改善します。
外側のループでは、正確なOpenCASCADEの計測（例：バウンディングボックスの寸法、体積、ソリッドの妥当性）と、別のビジョン-言語モデル「Judge」によるより高次の形状評価を組み合わせた、プログラム的な幾何検証を用います。
このアプローチは、実行時の問題（内側のループ）と幾何学的な正しさ（外側のループ）の両方を修正し、単一パスや純粋に視覚ベースの手法では見逃しがちな寸法エラーの解消を目指します。
CADSmithは、微調整（fine-tuning）ではなく、最新のAPIドキュメントに対する検索強化生成（retrieval-augmented generation）を用いることで、基盤となるCADライブラリの変更を追跡できるようにしています。
100個のプロンプトによるベンチマーク（難易度ティアおよびアブレーション付き）で、CADSmithは実行成功率がより高いこと（100% vs 95%）、F1/IoUの改善、さらにゼロショットのベースラインに比べて平均Chamfer Distanceが劇的に減少していることを報告しており、LLMによって生成されたCAD出力の信頼性と精度が向上していることを示しています。