GIFT: 幾何学的フィードバックによる画像からCADプログラムへの合成をブートストラップする
arXiv cs.LG / 2026/3/31
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、画像からCADプログラム合成における中核的なボトルネックを、設計の複雑さが増すにつれて、視覚的な幾何と記号的なプログラム構文を確実に対応付けるための十分な学習データが不足している点として特定する。
- Geometric Inference Feedback Tuning(GIFT)と呼ぶデータ拡張フレームワークを提案し、テスト時の予測から得られる幾何学的フィードバックを用いて、追加の高品質な学習例をブートストラップする。
- GIFTには2つの手法が含まれる——多様で高忠実度なプログラムを維持するSoft-Rejection Samplingと、ニアミス出力をより難しい幾何に対する合成学習サンプルへ変換するFailure-Driven Augmentationである。
- 本手法は、推論時の探索をモデルパラメータへ償却(amortize)することで、強力な教師ありベースラインに比べて平均IoUを12%改善しつつ、推論計算量を約80%削減する。
- 著者らは、より複雑なマルチモーダル・システムに対して競争力のある性能を報告しており、人手による注釈を追加せず、また特殊なモデル構造を必要としない。

