指示(タスク)に応じたロボット検査のためのスキャン設定:視覚言語埋め込みと超次元計算によるパラメータ最適化

arXiv cs.CV / 2026/5/6

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

要点

  • 本研究は、ロボットのレーザープロファイリングにおいて計測品質がセンサー設定パラメータに強く左右される一方、現在は試行錯誤で調整されているという課題に焦点を当てています。
  • 事前スキャンのRGB観測と自然言語の検査指示を入力として、ロボット搭載プロファイラの主要パラメータから離散的な設定候補を推定する、指示条件付きのセンシング設定提案を提案します。
  • 評価のために、検査インテントと16物体における多視点の姿勢・照明変動、さらに標準的なパラメータ領域を結び付けた実環境マルチモーダルデータセット Instruct-Obs2Param を新たに構築します。
  • ScanHD と呼ぶ超次元計算(ハイパーディメンショナル・コンピューティング)の枠組みを示し、指示と観測をタスクに応じたコードとして結合して、パラメータごとの連想的推論を行うことで高速・解釈可能・低遅延の設定決定を実現します。
  • Instruct-Obs2Param 上で、ScanHD は5つのパラメータに関して平均の exact accuracy 92.7%、Win@1 98.1%を報告し、ヒューリスティックや従来のマルチモーダル/マルチモーダルLLMよりも高性能で、汎化性能も高いとしています。

Abstract

ロボティックなレーザープロファイリングは、寸法検証や表面検査に広く用いられている一方で、計測の忠実性はしばしばロボットの動作ではなくセンサー構成によって支配されます。産業用プロファイラでは、サンプリング周波数、計測レンジ、露光時間、受信機のダイナミックレンジ、照明など、複数の連動したパラメータが公開されていますが、これらはいまだに試行錯誤によって調整されています。パラメータの不一致は、飽和、クリッピング、あるいは下流で回復不能な戻り信号の欠落を引き起こし得ます。そこで本研究では、指示に条件付けされたセンシングパラメータの推奨を定式化します。事前スキャンのRGB観測と、自然言語の検査指示が与えられたとき、ロボット搭載型プロファイラの主要パラメータに関して離散的な構成を推論します。この問題をベンチマークするために、16物体にわたる複数視点のポーズと照明の変動、および検査意図を結び付ける実世界のマルチモーダルデータセットであるInstruct-Obs2Paramを構築します。さらに、命令と観測をタスクに応じたコードへ結び付け、コンパクトなメモリを用いたパラメータ単位の連想推論を行うことで、離散的なスキャナレジームに適合しつつ、安定した、解釈可能で、低遅延の意思決定を可能にする高次元計算(ハイパーディメンショナル・コンピューティング)フレームワークScanHDを提案します。Instruct-Obs2Paramにおいて、ScanHDは5つのパラメータすべてにわたり、平均厳密一致精度92.7%および平均Win@1精度98.1%を達成し、強いクロス分割(cross-split)での汎化と、導入に適した低遅延推論を示します。これは、ルールベースのヒューリスティック、従来のマルチモーダルモデル、そしてマルチモーダル大規模言語モデルに対して優れています。本研究は、タスク意図とシーン文脈から、自律的に指示に条件付けされたセンシング構成を可能にし、手動でのチューニングを不要にするとともに、センサー構成を静的な設定から適応的な意思決定変数へと引き上げます。