時系列予測におけるモデル選択が失敗する理由：データレジーム間での不安定性に関する実証研究

arXiv stat.ML / 2026/5/5

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本研究は、時系列予測におけるモデル選択が、統計的・構造的に異なる「データレジーム」を持つデータ間では一般化しにくいことを示しています。
トレンドの強さ、季節性、ノイズ量、時間的依存性といった測定可能な特性を用いて時系列を特徴づける記述子（デスクリプタ）ベースの枠組みを提案しています。
これらの記述子から候補となる予測モデルを選ぶルールベースの仕組みを用いて評価した結果、精度が低く、経験的に最適なモデルを当てることは少数のケースに限られました。
データの特性と予測ホライズンの両方に対して性能が大きく左右され、特にノイジーで混在したレジームではランキングの不安定性が顕著でした。
結論として、固定的で静的な記述子ベース／ヒューリスティックな選択では予測性能を信頼できる形で予測できず、より適応的でデータ駆動の戦略が必要だと述べています。

Abstract

時系列予測モデルは、統計的および構造的特性が異なるデータセット間で、しばしば一貫しない性能を示します。利用可能な予測手法の幅広さにもかかわらず、単純なデータ特性によってモデル選択を確実に導けるかどうかは、依然として明らかではありません。本論文は、データレジームの記述子とモデル性能の関係を分析することで、時系列予測においてルールベースのモデル選択が失敗する理由を調査します。トレンド強度、季節性、ノイズ水準、時間的依存性といった測定可能な特性を含めて時系列を特徴づけるための記述子ベースの枠組みを導入します。これらの記述子に基づき、データレジームから候補となる予測モデルへ写像するルールベースの選択メカニズムを定式化します。このアプローチは、異なる領域および予測ホライズンにまたがる複数の実世界データセットで評価されます。その結果、ルールベースのモデル選択は精度が低く、正しいモデルの同定が起きるのはごく一部のケースに限られることが示されます。特にノイジーで混合したレジームにおいて、推奨モデルと経験的に最適なモデルの間には大きな食い違いが観察されます。さらに分析すると、モデル性能はデータセットの特性と予測ホライズンの両方に対して非常に敏感であり、シナリオ間で順位付けの不安定性が大きく生じることが明らかになります。これらの知見は、なぜ単純な経験則が汎化に失敗するのかを説明するとともに、予測性能が静的な記述子ベースのアプローチによって確実に予測できないことを示します。本研究は、時系列予測におけるモデル選択は本質的に文脈依存であることを示す実証的な証拠を提供し、より適応的でデータ駆動型の戦略の必要性を強調します。