目標条件付き強化学習の観点から捉えるミドルマイル・ロジスティクス

arXiv stat.ML / 2026/5/5

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、トラックの有限な容量を前提に、ハブ間を結ぶネットワーク上で荷物をルーティングするミドルマイル・ロジスティクスの問題を扱います。
  • ロジスティクス問題を、多目的かつ目標条件付きのマルコフ決定過程(MDP)として再定式化し、ルーティング時のさまざまな目標を扱えるようにしています。
  • 提案手法は、グラフニューラルネットワーク(GNN)とモデルフリー強化学習(RL)を組み合わせ、環境状態から得られる小規模な特徴グラフを用います。
  • arXiv:2605.02461v1として新規にアナウンスされ、ネットワークや容量制約を満たすルーティング方策の学習を目指しています。

要旨: ミドルマイル・ロジスティクスは、有限の容量をもつトラックによって結ばれたハブのネットワークを通じて小包を配送するための経路計画の問題を指します。私たちはこれを、多目的の目標条件付きMDPとして言い換えます。提案手法は、グラフニューラルネットワークとモデルフリーRLを組み合わせ、環境状態から小さな特徴グラフを抽出します。