ShapeY:最近傍マッチングによって形状認識能力を測定するための原理的フレームワーク
arXiv cs.CV / 2026/4/29
📰 ニュースModels & Research
要点
- 本論文では、物体認識システムが質感や背景といった非形状の手がかりではなく、形状情報をどれだけ使えているかを測るためのベンチマーク「ShapeY」を提案する。
- ShapeYは、多視点でレンダリングした200の3D物体の68,200枚のグレースケール画像を含み、必要に応じて外観(非形状)変化も加えられる。また、埋め込みを最近傍マッチング課題で評価する。
- このベンチマークは、視点が変わったり他の外観変化が入っても、ビューが3D形状の類似性に基づいてクラスタ化されるかを検証し、誤り率グラフやマッチングスコアのヒストグラムなど、複数の定量・定性指標を出力する。
- 321の事前学習済みネットワークを検証した結果、最先端モデルでさえ、3D視点や外観変化に対して頑健に形状ベースで汎化するのが難しく、まれに全く異なる形状同士を誤って強くマッチさせる傾向が見られる。
- 総じてShapeYは、分離された表現や視点・外観に不変なエンコーディングの重要性を強調し、人に近い形状認識能力へ人工視覚を導くための原理的な枠組みを提供する。


