自律型ハードドライブ解体のためのフリンジ投影に基づくビジョン・パイプライン

arXiv cs.RO / 2026/4/21

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

共有:

要点

本論文は、フリンジ投影による3Dセンシングと、リアルタイムなシーン理解および部品／ファスナーの位置特定を組み合わせた、自律型ハードドライブ解体向けのビジョン・パイプラインを提案しています。
フリンジ投影プロフィロメトリ（FPP）モジュールで3Dセンシングを行い、FPPが失敗する場合に深度補完モジュールを選択的に起動することで、センシング条件が難しい場面でも頑健性を高めています。
同一のFPPカメラ—プロジェクタ系を、深度推定とコンポーネントのローカライズの両方に流用することで、RGB-D方式のような登録（レジストレーション）なしで、深度・3D形状とセグメンテーションマスクをピクセル単位で整合させられる利点があります。
配備を見据えて学習済みの深度補完ネットワークとインスタンスセグメンテーションネットワークを最適化し、箱mAP@50=0.960／マスクmAP@50=0.957の高いインスタンスセグメンテーション性能、RMSE=2.317 mm／MAE=1.836 mmの深度精度、さらに12.86 ms・77.7 FPSのリアルタイム性能を報告しています。
sim-to-real転移学習により物理データセットを補強し、HDDインスタンスセグメンテーション用の合成データセットを公開する予定です。

要旨: 回収されない電子廃棄物は、重大な経済的損失を表す。ハードディスクドライブ（HDD）は価値の高い電子廃棄物の流れを構成しており、ロボットによる分解が必要となる。HDDの分解を自動化するには、ホリスティックな3Dセンシング、シーン理解、およびファスナー（留め具）のローカライズが必要であるが、現在の手法は断片的であり、頑健な3Dセンシングを欠き、またファスナーのローカライズも欠いている。そこで我々は、自律型のビジョン処理パイプラインを提案する。このパイプラインでは、Fringe Projection Profilometry（FPP）モジュールを用いて3Dセンシングを行い、FPPが失敗する場合に限って深度補完モジュールを選択的に起動する。さらに、このモジュールを、軽量なリアルタイムのインスタンスセグメンテーション・ネットワークと統合し、シーン理解と重要構成要素のローカライズを実現する。我々は、深度センシングモジュールと構成要素ローカライズモジュールの両方に同一のFPPカメラ・プロジェクタシステムを利用することで、生成される深度マップおよびそこから得られる3Dジオメトリが、登録なしでセグメンテーションマスクと本質的に画素単位で整合する。この点は、産業用センシングで一般的なRGB-D知覚システムに対する利点となる。我々は、配備（デプロイメント）向け推論のために、訓練した深度補完ネットワークとインスタンスセグメンテーションネットワークの両方を最適化する。提案システムは、インスタンスセグメンテーションにおいてbox mAP@50が0.960、mask mAP@50が0.957を達成する。また、Depth Anything V2 Baseバックボーンを用いた選択した深度補完構成は、RMSEが2.317 mm、MAEが1.836 mmである。さらに、評価用ワークステーション上で、Platter Facingの学習済み推論スタックは、合計レイテンシ12.86 ms、スループット77.7 Frames Per Second（FPS）を達成した。最後に、物理データセットを拡張するために、sim-to-realの転移学習アプローチを採用する。提案する知覚パイプラインは、高精度な意味情報と空間情報の両方を提供でき、下流のロボット分解に有用である可能性がある。HDDのインスタンスセグメンテーション用に開発した合成データセットは、公開される予定である。

レゾナックなど27社、半導体で新連合後工程に大型パネル

日経XTECH

Capsule Securityがシード資金700万ドルでステルスから浮上

Dev.to

AI時代のコーディング教育を再考する

Dev.to

Agent Package Manager（APM）：再現可能なAIエージェントのためのDevOpsガイド

Dev.to

実開発でClaude、GPT-4o、Geminiをベンチマークして学んだ3つのこと

Dev.to

自律型ハードドライブ解体のためのフリンジ投影に基づくビジョン・パイプライン

要点

関連記事

レゾナックなど27社、半導体で新連合後工程に大型パネル

Capsule Securityがシード資金700万ドルでステルスから浮上

AI時代のコーディング教育を再考する

Agent Package Manager（APM）：再現可能なAIエージェントのためのDevOpsガイド

実開発でClaude、GPT-4o、Geminiをベンチマークして学んだ3つのこと

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

レゾナックなど27社、半導体で新連合 後工程に大型パネル

Capsule Securityがシード資金700万ドルでステルスから浮上

AI時代のコーディング教育を再考する

Agent Package Manager（APM）：再現可能なAIエージェントのためのDevOpsガイド

実開発でClaude、GPT-4o、Geminiをベンチマークして学んだ3つのこと

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

レゾナックなど27社、半導体で新連合後工程に大型パネル