人とロボットの作業計画・割当てのための効率的強化学習を備えた階層型空間認識アルゴリズム：生産現場における

arXiv cs.AI / 2026/4/15

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は先進製造における人-ロボット作業計画・割当て（TPA）を対象とする。ここでは、リアルタイムの人の位置や移動距離といった空間的要因により、動的環境でのTPAが困難になる。
生産作業を逐次的なサブタスクへ分解し、高位プランナと低位アロケータから成る階層的アプローチを用いる。
高位計画では、訓練時間の削減と、長期かつ疎な報酬へのより適切な対応を目的とした、効率的バッファベースの深層Q学習（EBQ）手法を提案する。
低位割当てでは、ナビゲーションの可行性とシーケンスに基づいて、適切な人-ロボットのリソースへ作業を割り当てるための、空間認識型パス計画（SAP）手法を導入する。
複雑な3次元・リアルタイムの生産シミュレータにおける実験により、EBQ&SAPの組合せが複雑かつ動的な条件下でTPAを効果的に解決できることを示す。

要旨: 高度な製造システムにおいては、人間とロボットが協調して生産プロセスを実行します。高い生産効率を達成するためには、タスク計画・割当（TPA）が重要ですが、複雑で動的な製造環境では依然として困難です。人間とロボットの動的な性質、特に空間情報（例：人間のリアルタイムの位置や、タスクを完了するために移動する必要のある距離）を考慮する必要があることにより、TPAは大幅に複雑化します。上記の課題に対処するため、私たちは生産タスクを扱いやすいサブタスクに分解します。さらに、高いレベルのエージェントによるタスク計画と、低いレベルのエージェントによるタスク割当を含む、リアルタイム階層型の人間-ロボットTPAアルゴリズムを実装します。高いレベルのエージェントには、訓練時間を削減し、長期的かつ疎な報酬という課題を伴う生産問題において性能を向上させる、効率的なバッファベースの深層Q学習手法（EBQ）を提案します。低いレベルのエージェントには、パス計画に基づく空間認識型手法（SAP）を設計し、タスクを適切な人間-ロボットのリソースに割り当てることで、対応する一連のサブタスクを実現します。3Dシミュレータ上で、複雑なリアルタイムの生産プロセスに対する実験を行いました。結果は、提案手法であるEBQ&SAPが、複雑かつ動的な生産プロセスにおける人間-ロボットTPA問題を効果的に扱えることを示しています。