基盤モデルを用いたテンプレートベースの物体検出

arXiv cs.CV / 2026/3/23

💬 オピニオンTools & Practical UsageIndustry & Market MovesModels & Research

共有:

要点

本論文は、セグメンテーションの基盤モデルとシンプルな特徴ベースの分類器を組み合わせて、訓練データと再訓練を回避するテンプレートベースの物体検出手法を提案する。
データの変動が限られたユースケースを対象とし、データセットを新たに作成する必要がないことを強調し、新しい物体やデザインへの容易な適応を可能にする。
この手法は、ソフトウェア開発時のGUI自動テスト、特に継続的インテグレーションテストを動機としている。
著者らは、車載UIテストの自動化を支援するため、ナビゲーションマップのアイコンを検出・分類する評価を行っている。
結果は、訓練なしでYOLOのような学習ベースの検出器とほぼ同等の性能を示し、物体が変化する場合に潜在的な時間とコストの削減を提供する。

要約: 現在広く用いられている物体検出手法の多くは学習ベースであり、外観がさまざまに変化する物体を検出できます。これらのモデルはトレーニングとトレーニングデータセットを必要とします。データの変動が少ないユースケースに焦点を当てますが、トレーニングデータの生成とトレーニングを不要とする要件を満たします。このような設定は、ソフトウェア開発中のグラフィカルユーザーインタフェース（GUI）の自動テスト、特に継続的インテグレーションテストの場面で、たとえば望まれます。私たちのアプローチでは、セグメンテーション基盤モデルのセグメントを用い、それらを単純な特徴ベースの分類手法と組み合わせます。これにより、検索対象のオブジェクトやその設計を変更する際の時間とコストを節約できます。再トレーニングは不要で、データセットを作成する必要もありません。私たちは、ナビゲーション地図上のアイコンを検出・分類する課題でこの手法を評価します。これは自動車産業におけるユーザーインターフェースのテストを簡素化・自動化するために用いられます。私たちの方法は、YOLOのような学習ベースの物体検出手法とほぼ同等の結果を、トレーニングを必要とせずに達成します。

返却形式: {"translated": "翻訳されたHTML"}