要旨:移動ロボットにとって、効果的で効率的なタスク計画は不可欠であり、特に倉庫からの取得作業や環境モニタリングといった応用分野で重要です。これらのタスクは、多くの場合、複数のターゲットクラスタのそれぞれから1つの場所を選択することを含み、Generalized Traveling Salesman Problem (GTSP) を形成します。これは正確さと効率の両方の点で依然として解くのが難しい課題です。これを解決するために、グラフと画像ベースの表現の両方を活用して問題の補完的な側面を捉え、リアルタイムで高品質なタスク計画スキームを生成できるポリシーを学習する Multimodal Fused Learning (MMFL) フレームワークを提案します。具体的には、GTSPインスタンスを空間的に情報量の多い表現へ変換する座標ベースの画像ビルダーを初めに導入します。次に、さまざまな問題スケールに対する適応性を高めるための適応型解像度スケーリング戦略を設計し、幾何特徴と空間特徴の効果的な統合を可能にする専用ボトルネックを備えたマルチモーダル融合モジュールを開発します。広範な実験により、我々の MMFL アプローチは、さまざまな GTSP インスタンスにおいて最先端手法を著しく上回りつつ、リアルタイムロボットアプリケーションに必要な計算効率を維持することを示しました。実機ロボットによるテストは、現実世界のシナリオにおけるその実用効果をさらに検証します。
ロボット作業計画における一般化巡回セールスマン問題を解決するためのマルチモーダル融合学習
arXiv cs.RO / 2026/3/23
💬 オピニオンTools & Practical UsageModels & Research
要点
- MMFLフレームワークは、グラフベース表現と画像ベース表現を融合して、ロボット作業計画におけるGTSP(一般化巡回セールスマン問題)に対処する。
- GTSPのインスタンスを空間的に情報量のある表現へ変換する座標ベースの画像ビルダーと、異なる問題サイズに対応する適応的解像度スケーリング戦略を導入する。
- このアーキテクチャには、幾何学的特徴と空間的特徴をリアルタイム計画のために効果的に統合する専用のボトルネックを備えたマルチモーダル融合モジュールが含まれる。
- 実験結果は、MMFLがさまざまなGTSPインスタンスで最先端手法を著しく上回ることを示しており、実機ロボットによるテストは実世界での適用性と効率を確認している。