汎用的な小物体検出:ポイント・プロンプト型パラダイムとベンチマーク
arXiv cs.CV / 2026/4/6
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、小物体検出における高品質データの長年にわたる不足に対処するための、大規模・マルチドメイン・データセット「TinySet-9M」を提案する。
- 小物体に対するラベル効率的な検出手法を評価するためのベンチマークを確立し、その結果、弱い視覚的手がかりがラベル効率的アプローチの性能を著しく悪化させることを見出す。
- 学習時の特徴強化に依存せずに意味表現を改善するため、著者らは推論時に疎なポイント・プロンプトを用いて、カテゴリレベルの位置特定を橋渡しする「Point-Prompt Small Object Detection(P2SOD)」を提案する。
- P2SODおよびTinySet-9Mに基づき、本論文は、大規模データから頑健なプロンプト条件付き表現を学習する、スケーラブルで移植可能なポイント・プロンプト型フレームワーク「DEAL」を提示する。
- DEALは、厳格な位置特定指標(例:AP75)において、完全教師ありのベースラインに対して相対的に31.4%の改善を達成し、さらに推論時に1クリックのみで未見のカテゴリやデータセットにも汎化する、とされている。




