正規化マッチング・トランスフォーマー
arXiv cs.CV / 2026/5/6
📰 ニュースModels & Research
要点
- 正規化マッチング・トランスフォーマー(NMT)は、画像ペア間のスパースな意味的キーポイント対応を効率的かつ高精度に行うための深層学習手法として提案されています。
- NMTは、視覚バックボーン、幾何学的な特徴の改良としてSplineCNN、そして正規化されたTransformerによるマッチング特徴の計算から構成されます。
- 中核となるのは「超球面正規化」で、Transformerの各層で埋め込みベクトルのノルムを1に制約し、InfoNCE(コントラスト学習)と超球面の一様性損失を組み合わせて学習します。
- この設計は、対応する特徴同士を近づけ、対応しない特徴同士を遠ざけることを出力だけでなく中間層でも促します。
- PascalVOCおよびSPair-71kで新たな最先端性能を達成し、既存手法を上回るとともに、少なくとも他の最先端基準より1.7倍少ないエポックで収束することが示されています。



