人-ロボット協調におけるマルチモーダル異常検知

arXiv cs.RO / 2026/4/13

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、人-ロボット協調のための再構成ベースの異常検知フレームワークであるMADRIを提案し、まず動画ストリームを意味的に有意な特徴ベクトルへと変換する。
それは、視覚のみの異常検知を拡張し、視覚特徴にロボット内部のセンサ読み取りとScene Graphを融合することで、外部環境の逸脱と内部ロボットの故障の両方を捉える。
著者らは、提案手法を評価するために、ピックアンドプレース課題に対して正常条件と異常条件の両方を含む独自データセットを作成した。
結果は、視覚から導出した特徴ベクトルを再構成することで異常を効果的に検知できること、さらに追加モダリティを加えることで全体の検知性能が向上することを示している。

Abstract

人とロボットの相互作用（HRI）において安全性と信頼性を確保するには、システムの故障や危険な挙動につながり得る予期しない事象を、適時に検出することが必要です。そのため、異常検出は、協調作業中にロボットが通常の運用からの逸脱を認識し、応答できるようにする上で重要な役割を果たします。再構成モデルはHRIの分野で積極的に検討されてきましたが、特徴ベクトルに直接作用するアプローチは、ほとんど未開拓のままです。本研究では、MADRIというフレームワークを提案します。これは、まず動画ストリームを意味的に有意味な特徴ベクトルへと変換し、その後、再構成に基づく異常検出を行います。さらに、これらの視覚特徴ベクトルを、ロボット内部センサの計測値とシーン・グラフで拡張し、視覚環境における外部の異常と、ロボット自身における内部の故障の両方をモデルが捉えられるようにします。本手法を評価するために、通常時および異常時の条件下で行う、単純なピックアンドプレースのロボット作業からなる独自データセットを収集しました。実験結果は、視覚ベースの特徴ベクトルのみに対する再構成でも異常の検出に有効であることを示し、一方で他のモダリティを組み込むことで検出性能がさらに向上することを明らかにしています。これは、人とロボットの協調における頑健な異常検出に対して、マルチモーダルな特徴再構成がもたらす利点を強調しています。

ロボット用フィジカルAIのVLAがサブミリ精度獲得、Physical Intelligenceがオンライン強化学習で

日経XTECH

日立やNEC、フィジカルAIで脱「人月商売」／AIエージェント時代に台頭する「FDE」など、注目記事を音声化

日経XTECH

注目集める「AIエージェント」、一問一答型から自律的なシステムに

日経XTECH

新モデル「Claude Mythos」の衝撃数千の脆弱性を発見、一般公開せず

日経XTECH

「対応せざるを得ない」、Anthropicの「Mythos」に身構える日本の金融業界

日経XTECH

人-ロボット協調におけるマルチモーダル異常検知

要点

Abstract

関連記事

ロボット用フィジカルAIのVLAがサブミリ精度獲得、Physical Intelligenceがオンライン強化学習で

日立やNEC、フィジカルAIで脱「人月商売」／AIエージェント時代に台頭する「FDE」など、注目記事を音声化

注目集める「AIエージェント」、一問一答型から自律的なシステムに

新モデル「Claude Mythos」の衝撃数千の脆弱性を発見、一般公開せず

「対応せざるを得ない」、Anthropicの「Mythos」に身構える日本の金融業界

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

Abstract

関連記事

ロボット用フィジカルAIのVLAがサブミリ精度獲得、Physical Intelligenceがオンライン強化学習で

日立やNEC、フィジカルAIで脱「人月商売」／AIエージェント時代に台頭する「FDE」 など、注目記事を音声化

注目集める「AIエージェント」、一問一答型から自律的なシステムに

新モデル「Claude Mythos」の衝撃 数千の脆弱性を発見、一般公開せず

「対応せざるを得ない」、Anthropicの「Mythos」に身構える日本の金融業界

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

日立やNEC、フィジカルAIで脱「人月商売」／AIエージェント時代に台頭する「FDE」など、注目記事を音声化

新モデル「Claude Mythos」の衝撃数千の脆弱性を発見、一般公開せず