教師あり次元削減を再考:凍結したCNN特徴に対するLDAがもう一度見直されるべき理由

arXiv cs.LG / 2026/4/7

📰 ニュース

要点

  • 本論文は、需要の状態(レジーム)ごとに過去の配車履歴をセグメントし、6つの指標に基づく類似度アンサンブルによって現在の期間を類似する過去の局面(アナロジー)に対応付けたうえで、意思決定に用いるキャリブレーション済み需要事前分布を構築する、「レジーム校正済み」の配車ディスパッチ枠組みを提案する。

Abstract

効果的な乗車配車(ライドヘイリングのディスパッチ)には、日中の時間帯、曜日、季節、特別イベントによって大きく変動する需要パターンを見越すことが必要である。そこで我々は、(i) 過去の移動データを需要レジームに分割し、(ii) 現在の運行期間を、6つの指標からなる類似度アンサンブル(Kolmogorov-Smirnov、Wasserstein-1、特徴距離、分散比、イベントパターン、時間的近接性)によって最も類似した過去の類例に対応付け、(iii) 得られた調整済み需要事前分布を用いて、LPベースの車両再配置方策と、ハンガリアン(Hungarian)マッチングによるバッチ配車の双方を駆動する、というレジーム調整型のアプローチを提案する。アブレーションでは、分布のみのサブセットが平均待ち時間で最も強力である一方、堅牢性を重視したデフォルトとして全アンサンブルを保持する。 5つのランダムシードそれぞれで、冬/夏、平日/休日、午前/午後/夜という8つの多様なシナリオにおいて、ニューヨーク市のTLC(走行記録)5.2百万件で評価した結果、我々の手法は平均乗客待ち時間を31.1%削減する(ブートストラップ 95% CI: [26.5, 36.6]%; Friedmanのchi二乗 = 80.0, p = 4.25e-18; シナリオ間でのCohenのd = 7.5-29.9)。改善は末尾にも及び、P95待ち時間は37.6%低下し、待ち時間のジニ係数は0.441から0.409へ改善した(相対7.3%)。2つの寄与は乗法的に合成され、独立に検証されている:調整によって16.9%削減され、LPによる再配置はさらに15.5%上乗せする。提案手法は学習を必要とせず、決定論的で説明可能であり、シカゴにも一般化する(NYCのレジームライブラリに基づき待ち時間を23.3%削減)うえ、車両規模に対しても頑健である(0.5〜2倍のスケーリングで32〜47%の改善)。我々は包括的なアブレーション研究、厳密な統計的検定、およびOSRMによるルーティング忠実度(routing-fidelity)検証を提供する。