要旨: 半教師付きの群衆分析は、ラベルなしデータが通常豊富で入手コストも低いことから、重要な研究分野である。しかし、従来の点ベースのアノテーションは個々の領域が本質的に曖昧であるため性能を制約し、その結果、まばらなアノテーションから微細な構造意味を学習することは未解決の課題であり続けている。本研究では、Nearest Neighbor Exclusion Circle (NNEC) 制約に基づく Exclusion-Constrained Dual-Prompt SAM (EDP-SAM) を提案し、現在のデータセットに対するマスク監督信号を生成します。密集したシーンの個人をセグメント化することを目的として、Exclusivity-Guided Mask Learning (XMask) を提案します。これは判別的マスク目的関数を通じて空間的分離を強制します。ガウス平滑化と微分可能なセンターサンプリング戦略を用いて特徴の連続性と学習の安定性を向上させます。XMask を基盤として、インスタンスマスクの事前情報を擬似ラベルとして用いる半教師付きの群衆カウントフレームワークを提示します。これらは従来の点の手掛かりよりも豊かな形状情報を含みます。ShanghaiTech A、UCF-QNRF、JHU++ のデータセット(ラベル付きデータをそれぞれ 5%、10%、40% 使用)における広範な実験により、私たちのエンドツーエンドモデルが最先端の半教師付きセグメンテーションとカウントの性能を達成し、統一されたフレームワーク内でカウントとインスタンスセグメンテーションのギャップを効果的に埋めることを検証しました。
半教師付き群衆インスタンス分割とカウントのための排他性ガイド付きマスク学習
arXiv cs.CV / 2026/3/18
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、最近傍排除円 (NNEC) 制約を組み込んだ排除制約付きデュアル・プロンプト SAM (EDP-SAM) を提案し、混雑したシーンのデータセットに対するマスクの教師信号を生成する。
- 次に、排他性ガイド付きマスク学習 (XMask) を提案する。これは、密集した群衆におけるインスタンス間の空間的分離を強制する識別的目的関数である。
- 本手法は、ガウス平滑化と微分可能な中心サンプリング戦略を採用し、半教師あり学習中の特徴の連続性とトレーニングの安定性を高める。
- XMask に基づく半教師ありの群衆カウントフレームワークは、インスタンスマスクの事前情報を擬似ラベルとして用い、ShanghaiTech A、UCF-QNRF、JHU++ において、5–40% のラベル付きデータで最先端の性能を達成し、カウントとインスタンス分割を統一モデルで結びつけている。

