粒度ボール計算によるスクエア・スーパーピクセル生成と表現学習
arXiv cs.CV / 2026/4/1
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、既存手法の不規則な領域問題を回避するために、スーパーピクセルをマルチスケールの正方形ブロックで近似する新しいスーパーピクセル生成手法を提案する。
- ピクセル強度の類似性に基づく純度スコア選択戦略を導入し、高品質な正方形ブロックを保持して表現品質を向上させる。
- 整った正方形状の領域を用いることで、オフライン前処理に頼るのではなく、効率的な並列処理と深層学習へのより良い統合を可能にすることを目的とする。
- 得られる正方形スーパーピクセルは、GNNのグラフノードとして、またはVision Transformerのトークンとして利用でき、構造化されたマルチスケールな特徴集約を可能にする。
- 下流の視覚タスクに関する実験では一貫した性能向上が報告されており、この手法がエンドツーエンドで学習可能な視覚表現学習を強化することを示唆している。




