要旨: ほとんどのロボット把持システムは、センサデータを明示的な3D点群へ変換することに依存しており、これは生物知能には見られない計算ステップです。本論文は、6自由度把持検出のための根本的に異なる、ニューロインスパイアされたパラダイムを探究します。我々は SpikeGrasp を導入します。これは生物の視覚運動経路を模倣するフレームワークで、網膜と同様に、ステレオスパイクカメラからの生の非同期イベントを処理し、把持姿勢を直接推定します。我々のモデルは、これらのステレオスパイクストリームを統合し、高次視覚処理に類似した再帰的スパイキングニューラルネットワークを用いて、点群を再構成することなく、把持仮説を反復的に洗練します。このアプローチを検証するために、大規模な合成ベンチマークデータセットを作成しました。実験では、SpikeGrasp は従来の点群ベースのベースラインを上回ることを示し、特に混雑したシーンや質感のないシーンで顕著なデータ効率を示します。このエンドツーエンドのニューロインスパイアドアプローチの実現性を確立することにより、SpikeGrasp は自然界に見られる流動的で効率的な操作を可能にする将来のシステムへの道を開き、特に動的な物体に対して有効です。)
SpikeGrasp: ステレオスパイクストリームからの6自由度把持姿勢検出のベンチマーク
arXiv cs.RO / 2026/3/23
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- SpikeGraspは、ステレオスパイクカメラからの生の非同期イベントを用いた6自由度の把持姿勢検出のための、神経系に着想を得たエンドツーエンドのフレームワークを導入し、明示的な3D点群を用いない。
- それは、生物の視覚-運動系の経路を模倣し、把持仮説を反復的に洗練させる再帰型スパーキングニューラルネットワークを用いる。
- 本手法は、性能を評価するために、大規模な合成ベンチマークデータセット上で検証されている。
- 実験の結果、SpikeGraspは従来の点群ベースの基準手法を上回ることが示され、特に混雑した環境やテクスチャのないシーンで顕著である。データ効率性と、リアルタイムで動的なロボティクスへの可能性を浮き彫りにしている。