CADSmith:プログラム的幾何検証によるマルチエージェントCAD生成
arXiv cs.AI / 2026/3/30
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- CADSmithは、自然言語からCadQueryコードを生成するマルチエージェントのテキストto-CADシステムであり、2つのネスト(入れ子)のリファインメントループによってコードを改善します。
- 外側のループでは、正確なOpenCASCADEの計測(例:バウンディングボックスの寸法、体積、ソリッドの妥当性)と、別のビジョン-言語モデル「Judge」によるより高次の形状評価を組み合わせた、プログラム的な幾何検証を用います。
- このアプローチは、実行時の問題(内側のループ)と幾何学的な正しさ(外側のループ)の両方を修正し、単一パスや純粋に視覚ベースの手法では見逃しがちな寸法エラーの解消を目指します。
- CADSmithは、微調整(fine-tuning)ではなく、最新のAPIドキュメントに対する検索強化生成(retrieval-augmented generation)を用いることで、基盤となるCADライブラリの変更を追跡できるようにしています。
- 100個のプロンプトによるベンチマーク(難易度ティアおよびアブレーション付き)で、CADSmithは実行成功率がより高いこと(100% vs 95%)、F1/IoUの改善、さらにゼロショットのベースラインに比べて平均Chamfer Distanceが劇的に減少していることを報告しており、LLMによって生成されたCAD出力の信頼性と精度が向上していることを示しています。



