構造化プロトタイプ正則化を用いた合成データから実データへの運転シーン解析

arXiv cs.CV / 2026/3/18

📰 ニュースModels & Research

共有:

要点

本論文は、運転シーンのパース（解析）のための教師なしドメイン適応フレームワークを提案し、クラス特異的プロトタイプを用いて意味特徴の構造を明示的に正則化することで、合成データと実データのギャップを縮小し、クラス間の分離性とクラス内のコンパクト性を促進する。
疑似ラベルの信頼性を高めるエントロピーに基づくノイズフィルタリング戦略と、ドメイン間の特徴整合を洗練させるピクセルレベルのアテンション機構を組み合わせる。
代表的なベンチマークに対する広範な実験は、本手法が最近の最先端手法を一貫して上回ることを示しており、セマンティック構造を保持する価値を浮き彫りにしている。
自動ラベル付きの合成データを活用することで、アノテーションコストを削減しつつ、実世界の運転シーン解析の性能を向上させることを狙っている。

要旨: 自動運転車が複雑な実世界の交通環境で信頼性を持って動作するには、運転シーンの解析が極めて重要である。高価なピクセルレベルの注釈への依存を減らすために、自動生成ラベルを備えた合成データセットが人気の代替手段となっている。しかし、合成データで訓練されたモデルは、合成データと実世界のドメインギャップのため、実世界のシーンへ適用するとしばしば性能が低下する。このギャップを狭める教師なしドメイン適応の成功にもかかわらず、多くの既存手法は主にグローバルな特徴整合に焦点を当て、特徴空間の意味的構造を見落としている。その結果、クラス間の意味的関係が十分にモデル化されず、モデルの一般化能力を制限している。これらの課題に対処するため、本研究は、意味的特徴構造を明示的に正則化する新規の教師なしドメイン適応フレームワークを提案し、実世界のシナリオにおける運転シーン解析の性能を大幅に向上させる。具体的には、提案手法はクラス別プロトタイプを活用することで、クラス間の分離とクラス内の緊密さを強制し、特徴クラスタの判別性と構造的一貫性を高める。エントロピー基盤のノイズフィルタリング戦略は仮ラベルの信頼性を向上させ、ピクセルレベルのアテンション機構がさらに特徴の整合を洗練させる。代表的なベンチマークでの広範な実験により、提案手法は最近の最先端手法を一貫して上回ることを示している。これらの結果は、運転シーン解析タスクにおける頑健な合成データから実データへの適応のためには、意味構造を保持することの重要性を強調している。