変形を用いた6D物体ポーズ推定の探究

arXiv cs.CV / 2026/4/9

📰 ニュースSignals & Early TrendsModels & Research

要点

  • DeSOPEは、変形した6DoF(6D object pose)推定を扱うための大規模データセットとして提案され、26の一般的な物体カテゴリに対して高精細3Dスキャンを収録しています。
  • 各カテゴリは「正規形状の1状態」と「変形状態の3状態」を持ち、正規メッシュへの正確な3D登録が付与されています。
  • RGB-Dデータでは133Kフレームを収録し、665K件のポーズ注釈を半自動パイプラインで生成しており、2Dマスク→初期推定→オブジェクトレベルSLAMでの改良→手動検証という流れで品質を確保しています。
  • 複数の既存6Dポーズ手法を評価した結果、変形が大きくなるほど性能が急激に低下し、変形への頑健な対応が実利用に不可欠であることが示されています。

Abstract

本稿では、6DoF変形物体のための大規模データセットであるDeSOPEを提示します。ほとんどの6D物体姿勢推定手法は、剛体または関節状(関節化)された物体を前提としていますが、物体が摩耗、衝撃、変形などにより正準(canonical)な形状から逸脱するため、この前提は実運用では破綻します。これをモデル化するために、DeSOPEデータセットを導入します。このデータセットは、26の一般的な物体カテゴリについて高忠実度な3Dスキャンを収録しており、それぞれについて1つの正準状態と3つの変形状態を撮影し、正準メッシュへの正確な3D登録(registration)を備えています。さらに、RGB-Dデータセットとして、多様な状況にまたがる133Kフレームと、セミオートマティックなパイプラインで生成された665K件の姿勢アノテーションを提供します。まず各インスタンスごとに2Dマスクをアノテーションし、つづいて物体姿勢推定手法により初期姿勢を計算し、物体レベルのSLAMシステムでそれらを洗練(refine)し、最後に手動による検証を行って最終アノテーションを作成します。いくつかの物体姿勢推定手法を評価した結果、変形の増大に伴って性能が急激に低下することが分かり、そのような変形を頑健に扱うことが実用上重要であることを示唆しています。プロジェクトページとデータセットは https://desope-6d.github.io/}{https://desope-6d.github.io/ にて利用可能です。