要旨: ねじの種類の自動識別は、産業用オートメーション、ロボティクス、および在庫管理にとって重要です。しかし、ねじ分類の公開データセットは不足しており、特に自動仕分けシステムで一般的に遭遇する制御された単一オブジェクトの状況には乏しいです。本研究では、\textbf{SortScrews}を紹介します。ねじのケース別視覚分類のデータセットです。データセットは、512\times512 解像度の560枚のRGB画像を含み、6種類のねじと背景クラスをカバーします。画像は標準化された取得設定を用いてキャプチャされ、4つの撮影設定にわたって照明とカメラの視点の軽微な変化を含みます。
再現性のある研究とデータセットの拡張を促進するため、安価なカメラ設定を用いてカスタムハードウェア部品向けに同様のデータセットを簡単に構築できる再利用可能なデータ収集スクリプトも提供します。
ImageNetで事前学習済みのEfficientNet-B0およびResNet-18分類器を用いた転移学習でベースラインを確立します。さらに、十分に検討された故障分析を実施します。データセットサイズが限られているにもかかわらず、これらの軽量モデルは高い分類精度を達成し、制御された取得条件が相対的に小さなデータセットでも効果的な学習を可能にすることを示しています。データセット、収集パイプライン、およびベースラインのトレーニングコードは、https://github.com/ATATC/SortScrewsにて公開されています。
SortScrews: リアルタイムねじ分類のためのデータセットとベースライン
arXiv cs.CV / 2026/3/16
📰 ニュースTools & Practical UsageModels & Research
要点
- 産業環境での自動選別を目指したリアルタイムのねじ種別分類データセット「SortScrews」を紹介します。
- データセットは解像度512×512のRGB画像560枚を含み、6種類のねじと背景クラスをカバーしており、照明と視点のわずかな変化を加える4つの撮影設定を備えています。
- 他のハードウェア部品のデータセット構築にも役立つ再利用可能なデータ収集スクリプトが提供されており、再現性を促進します。
- EfficientNet-B0 および ResNet-18 を ImageNet で事前学習させた転移学習を用いたベースライン結果を報告しており、小規模なデータセットにもかかわらず高い性能を示すとともに、詳細な失敗分析を含みます。コードとデータセットは GitHub で公開されています。