AutoVDC:ビジョン・ランゲージモデルによる自動ビジョンデータクリーニング
arXiv cs.RO / 2026/5/1
💬 オピニオンTools & Practical UsageModels & Research
要点
- AutoVDCは、ビジョン・ランゲージモデル(VLM)を用いてビジョンデータセット内の誤ったアノテーションを自動検出し、手作業によるデータクリーニング工数を削減することを目指しています。
- 本研究では、自動運転のオブジェクト検出ベンチマークであるKITTIとnuImagesを用い、意図的にアノテーション誤りを混入させたデータセット変種を作成して、検出性能を評価します。
- 複数のVLM間での誤り検出率の比較を行い、さらにVLMのファインチューニングがクリーニングのパイプラインに与える影響も検討しています。
- 実験結果は、高い誤り検出性能とデータクリーニング効果を示しており、大規模な実運用データセットの信頼性と精度を高められる可能性を示唆します。
- 人手によるラベリングには不完全さがあり、実用品質に到達するまで複数回の高コストな見直しが必要になりがちなという課題に対処することが目的です。
