AI Navigate

高頻度データギャップを埋める: ミリ秒解像度のネットワークデータセットによる時系列基盤モデルの高度化

arXiv cs.LG / 2026/3/18

📰 ニュースSignals & Early TrendsModels & Research

要点

  • 本論文は、実稼働中の5G展開から得られたワイヤレスとトラフィック状況のミリ秒解像度データセットを紹介し、時系列基盤モデルを高頻度データへ拡張する。
  • 新たなドメインとしてワイヤレスネットワークを追加し、100ミリ秒から9.6秒までの予測区間を対象とした予測ユースケースを提供する。
  • ベンチマーク結果は、ほとんどのTSFM設定がこのデータ分布においてゼロショットとファインチューニングの両方の設定で苦戦することを示し、現行アーキテクチャのギャップを明らかにしている。
  • 本研究は、高頻度データセットを事前学習と予測に取り入れることで、TSFMの一般化性、頑健性、適応性を向上させ、現実世界のアプリケーションにおける適用性を改善できると提唱する。

概要: 時系列基盤モデル(TSFMs)は、さまざまなドメインと時間的周波数に適応するために、多様で実世界のデータセットを必要とします。 ただし、現在の大規模データセットは主に低周波の時系列に焦点を当てており、サンプリング間隔、すなわち時系列解像度が秒単位から年単位の範囲であるため、高頻度の時系列データのニュアンスを捉える能力を妨げています。 この制限に対処するため、実運用の5Gワイヤレス展開からミリ秒解像度の無線通信およびトラフィック条件を捉える新しいデータセットを導入し、事前学習のために高周波データを取り入れるようにTSFMsの対象範囲を拡張します。 さらに、このデータセットは新しいドメインとして無線ネットワークを導入し、エネルギーや金融といったより一般的なドメインを補完します。 このデータセットは短期予測のユースケースも提供しており、予測のホライズンは100ミリ秒(1ステップ)から9.6秒(96ステップ)まで広がります。 このデータセットを用いた伝統的な機械学習モデルおよびTSFMsの予測タスクのベンチマークを行うことで、多くのTSFMモデル構成が、この新しいデータ分布に対してゼロショットおよびファインチューニング設定のいずれにおいても性能が低いことを示しています。 私たちの研究は、事前学習および予測時に高頻度データセットを取り入れることの重要性を強調し、TSFMsのアーキテクチャ、ファインチューニング戦略、一般化、および実世界の応用におけるロバスト性を向上させることを示しています。