映像データから学習した潜在表現を用いたソフト連続体ロボットの高精度オープンループ制御

arXiv cs.RO / 2026/3/23

📰 ニュースTools & Practical UsageModels & Research

共有:

要点

Visual Oscillator Networks (VONs) と Attention Broadcast Decoder (ABCD) を用いた映像から学習した潜在ダイナミクスを通じて、ソフト連続体ロボットのオープンループ制御を導入し、解釈可能な2次元潜在表現を生成する。
カメラからのフィードバックなしで潜在空間におけるシングルショット最適制御を実行し、画像で指定されたウェイポイントを追跡する。ターゲットを潜在ウェイポイントへマッピングするため、対話型の SCR ライブ・シミュレータを用いる。
評価されたダイナミクスの中で、ABCD ベースのモデルは画像空間の追従誤差を低減し、VON-ABCD Koopman 変種が最も低い平均二乗誤差（MSE）を達成した。
アブレーション研究およびシミュレーションのストレステストは、安定した静的保持、外挿された平衡点、および静止状態への緩和を示し、解釈可能でビデオ学習に基づく潜在ダイナミクスが SCR の長期的なオープンループ制御を信頼性高く実現できることを初めて示すデモンストレーションとなった。

要旨: 本研究は、ビデオから学習した潜在ダイナミクスを用いたソフト連続体ロボット（SCR）の開ループ制御に取り組みます。 Visual Oscillator Networks (VONs) は前研究で用いられており、アテンション・ブロードキャスト・デコーダ（ABCD）を介して機械的に解釈可能な2Dオシレーター潜在表現を提供します。
カメラのフィードバックなしに、潜在空間で開ループ・シングルショット最適制御を実行し、画像で指定されたウェイポイントを追跡します。
対話型のSCRライブシミュレータは、静的・動的・外挿的ターゲットの設計を可能にし、それらをモデル固有の潜在ウェイポイントにマッピングします。
2セグメントの空気圧式SCRでは、Koopman、MLP、およびオシレーターのダイナミクスを、ABCDの有無にかかわらず、設定点と動的軌道で評価します。
ABCDベースのモデルは、画像空間での追従誤差を一貫して低減します。
VONおよびABCDベースのKoopmanモデルが最も低いMSEを達成します。
アブレーション研究を用いて、いくつかのアーキテクチャの選択と学習設定が開ループ制御性能に寄与することを示します。
シミュレーション・ストレステストは、静的保持、安定した外挿平衡、および静止状態への妥当な緩和をさらに確認します。
私たちの知る限り、解釈可能でビデオから学習した潜在ダイナミクスが、SCRの長期的な開ループ制御を信頼性高く実現できる、初めてのデモンストレーションです。

人型ロボットを被災建築物の調査に活用、建築研究所などが公開実験

日経XTECH

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

日経XTECH

文字起こしだけじゃない、要約から資料まで作る「AIボイスレコーダー」

日経XTECH

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

日経XTECH

Gmailで返信を自動作成、「Google AI Plus」で驚異の時短術

日経XTECH

映像データから学習した潜在表現を用いたソフト連続体ロボットの高精度オープンループ制御

要点

関連記事

人型ロボットを被災建築物の調査に活用、建築研究所などが公開実験

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

文字起こしだけじゃない、要約から資料まで作る「AIボイスレコーダー」

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

Gmailで返信を自動作成、「Google AI Plus」で驚異の時短術

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer