概要: 自動運転における構造化されたオンライン地図構築では、正確な3Dレーンセグメント検出とトポロジー推論が不可欠です。近年、トランスフォーマーベースの手法はこのタスクをクエリベースの集合予測として定式化していますが、概ねは小型の物体検出向けに元々開発されたデコーダ設計をそのまま継承しています。しかし、レーンセグメントは有向グラフに埋め込まれた連続的なポリラインであり、汎用的なクエリ初期化や制約のない洗練(リファインメント)では、この幾何学的および関係的な構造が明示的に符号化されません。そこで本研究では、GeoReFormer(Geometry-aware Refininement Transformer)を提案します。GeoReFormerは、トランスフォーマーデコーダ内部に幾何学とトポロジーに配慮した帰納バイアスを直接埋め込む、統一されたクエリベースのアーキテクチャです。GeoReFormerは、構造化されたクエリ初期化のためのデータ駆動型の幾何学的事前知識、安定したポリライン変形のための境界付き座標空間での洗練、そして関係的文脈を選択的に統合するためのクエリごとのゲート付きトポロジー伝播を導入します。OpenLane-V2ベンチマークにおいて、GeoReFormerは34.5%のmAPで最先端の性能を達成し、強力なトランスフォーマー基線に比べてトポロジーの一貫性も向上させています。これにより、明示的に幾何学的および関係的構造を符号化することの有用性が示されます。
GeoReFormer:レーンセグメント検出とトポロジー推論のためのジオメトリ認識型リファインメント
arXiv cs.CV / 2026/3/30
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- GeoReFormerは、3Dレーンセグメント検出とトポロジー推論のための統一型トランスフォーマベース手法であり、デコーダにジオメトリおよびトポロジーに配慮した帰納的バイアスを追加します。
- 汎用的な物体検出スタイルのクエリ初期化と制約のないリファインメントを用いる代わりに、データ駆動の幾何学的事前知識による構造化クエリ初期化と、安定したポリライン変形のための座標空間に対する有界なリファインメントを採用します。
- 本手法では、必要な有向グラフのレーントポロジー整合性のために関係文脈を選択的に統合するため、クエリごとのゲート付きトポロジー伝播を取り入れています。
- OpenLane-V2ベンチマークにおいて、GeoReFormerはmAP 34.5%を達成し、強力なトランスフォーマベースラインと比べてトポロジー整合性も向上させています。これは、レーンのジオメトリ/関係を明示的に符号化することの利点を示唆しています。