要旨: 本稿では、専門のCADエンジニアによって作成された3D CADモデルを編集するための、初のベンチマークであるneuralCAD-Editを導入します。従来研究のようなテキストによる条件付けではなく、プロのデザイナーの動画を収集し、CADソフト上でCADモデルに対して直接やり取りしながら、話す・指さす・描くといった行為を通して、現実的なCAD編集要求を収集します。本研究では、同意を得た10名のデザイナーを採用し、限定された本研究に貢献してもらいました。主要な基盤モデルを、人間のCAD専門家が編集作業を行う際と比較してベンチマークし、自動指標と人手評価の両方で大きな性能ギャップがあることを見いだします。最良の基盤モデルであっても(GPT 5.2)、人間による受容性テストにおいてCAD専門家より絶対値で53%低いスコアとなり、neuralCAD-Editの難しさが示されています。neuralCAD-Editが、3D CAD編集アプローチや基盤モデルを開発するための確固たる基盤を提供できることを期待します。コード/データ: https://autodeskailab.github.io/neuralCAD-Edit
neuralCAD-Edit:マルチモーダル指示による3D CADモデル編集のためのエキスパートベンチマーク
arXiv cs.CV / 2026/4/20
📰 ニュースSignals & Early TrendsModels & Research
要点
- この論文は、CADエンジニアの実際の専門家による入力から構築された、3D CADモデル編集の新しいベンチマーク「neuralCAD-Edit」を提案しています。
- 従来のテキスト条件付けとは異なり、CADソフト上で専門デザイナーがCADモデルを直接操作しながら、発話・指差し・描画を行う様子を記録することで、現実的な編集要求を収集しています。
- 主要な基盤モデルを人間のCAD専門家と比較した結果、自動評価指標と人間評価の両方で大きな性能差があることが分かりました。
- 人間の受容性(受け入れ)試験では、最良の基盤モデル(GPT 5.2)でもCAD専門家に比べて絶対値で約53%低く、マルチモーダルな指示に基づく3D CAD編集の難しさが示されています。
- 著者らは今後の3D CAD編集手法や基盤モデルの開発のための基準となるよう、コード/データを公開しています。
