バス乗客数予測におけるポリゴン(空間)ベース手法とグローバル型機械学習モデルの比較分析

arXiv cs.LG / 2026/5/4

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、都市全体を単一の均質な地域として扱うことで生じるバス乗客数(需要)予測の誤差に対し、空間的に局所化したモデリング戦略を提案している。
  • ルート番号・時間・バス停ごとの乗客データに加え、空間的な魅力度(目的地など)、気象条件、時刻や曜日といった時間パターンなどのオープンデータを用いて、空間クラスタリングと多次元特徴量分析を統合する枠組みを構築している。
  • 近距離にあるバス停は同様の乗客行動を持つという考え方にもとづいて都市をクラスタリングし、各クラスタごとに個別の局所予測モデルを学習する。
  • 空間を意識した局所的アプローチはグローバル型モデルと同程度の精度を示し、公共交通のより的確で効率的なサービス改善につながる可能性が示唆されている。
  • 総じて、クラスタリングによって地理的文脈を取り込むことが、公共交通需要予測の精度向上に有効であることを示す研究である。

Abstract

バスの利用者数(乗客数)の正確な予測は、公共交通システムを効率的に管理し、最適化するために重要である。従来の予測モデルは、都市全体を単一の均質な地域として扱うことで、異なる都市部に固有で局所的なダイナミクスを十分に捉えられないことが多い。本論文では、空間クラスタリング手法と多次元の特徴量解析を統合することで、バスの利用者数予測を高精度化する新しい枠組みを提案する。提案する枠組みは、バスの利用者数データ(路線番号、時間、バス停ごと)に加えて、魅力的な目的地などの空間的特徴、気象条件(気温、降雨など)、時間的パターン(日中の時間帯、曜日など)といったさまざまなオープンソースデータを含む、多様なデータ集合を利用する。都市部を、近い距離にあるバス停は同様の利用者数特性を共有するという原則に基づいて異なる地域にクラスタリングし、これらのクラスタごとに別個のローカル予測モデルを学習する。この局所化アプローチは、グローバルモデルと同等の精度を示す。得られた結果は、空間を考慮した局所的なモデリング戦略が公共交通の予測に有効であり、より的確で効率的なサービス改善へとつながることを示唆している。