要旨: 3Dスキャン、スケッチ、または単純なテキストプロンプトからのCAD(Computer-Aided Design)モデルのリバースエンジニアリングと迅速なプロトタイピングは、産業製品設計において重要です。しかし、幾何学的ディープラーニング技術の最近の進歩は、境界表現(BRep)に格納されたパラメトリックCAD機能の多模態理解を欠いています。本研究は、1000万件の多模態アノテーションとメタデータを100万のABC CADモデル、すなわちA2Zとして最大規模で取りまとめ、前例のないレベルのBRep学習を解き放ちます。A2Zは以下を含みます:(i) 鮮明な3Dスキャン特徴を備えた高解像度メッシュ、(ii) 3D手描きスケッチ、(iii) BRepの共辺、コーナー、表面に関する幾何学的およびトポロジ情報、(iv) 機械的世界の製品を説明するテキストキャプションとタグ。
このように慎重に構造化された大規模データを作成するには、比類のないCAD学習/検索タスクを活用するにはほぼ5テラバイトのストレージを要するため、非常に困難です。私たちの多模態アノテーションの規模、品質、および多様性は、新規の指標、GPT-5、Gemini、および広範な人間のフィードバック機構を用いて評価されます。この目的のため、熟練した専門家が設計した電子筐体(例:タブレット、ポート)25,000点のCADモデルをA2Zデータセットに追加で統合します。続いて、CADリバースエンジニアリングの主要な下流タスクである3DスキャンからのBRep共辺およびコーナー頂点を検出するため、150K CADモデルのサブセット上で基盤モデルを訓練・ベンチマークします。アノテーション済みデータセット、指標、およびチェックポイントは、多くの研究分野を支援するために公開されます。
A2Z-10M+: AからZまでの BRep アノテーションを用いた AI支援 CAD モデリングとリバースエンジニアリングの幾何深層学習
arXiv cs.CV / 2026/3/16
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- A2Z-10M+データセットは、100万のABC CADモデルに対して1,000万件のマルチモーダルアノテーションを統合しており、BRep対応学習をAI支援CADモデリングとリバースエンジニアリングに可能にします。
- 高解像度のメッシュ、BRepの共辺・頂点・表面を備えた3D手描きスケッチ、および部品を説明するテキストキャプションを含みます。
- データセットは約5テラバイトのストレージを必要とし、規模と品質を評価するために新規の指標と人間のフィードバック(GPT-5、Gemini)を用います。
- 現実世界でのカバレッジを広げるため、追加で25,000件のプロフェッショナルに設計された電子機器用エンクロージャCADモデルがデータセットに統合されました。
- 基盤モデルは、3DスキャンからBRepの共辺と頂点を検出するために、150,000 CADモデルのサブセットで訓練・ベンチマークされ、重要な下流タスクを示しています。
関連記事
Day 10: 230 Sessions of Hustle and It Comes Down to One Person Reading a Document
Dev.to

5 Dangerous Lies Behind Viral AI Coding Demos That Break in Production
Dev.to
Two bots, one confused server: what Nimbus revealed about AI agent identity
Dev.to

OpenTelemetry just standardized LLM tracing. Here's what it actually looks like in code.
Dev.to
PIXIU: A Large Language Model, Instruction Data and Evaluation Benchmark forFinance
Dev.to