時系列データに対する逐次的な整合化密度領域によるコンフォーマル予測

arXiv stat.ML / 2026/4/9

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、時系列に特化したコンフォーマル予測フレームワークであるSequential Conformalized Density Regions(SCDR)を導入し、条件付きカバレッジに関する漸近的保証を提供する。
  • SCDRは、推定した条件付き高密度領域から初期の予測領域を構築し、そのうえで、時系列の非交換可能な構造を扱うために、分位点ランダムフォレストに基づくコンフォーマル調整を適用する。
  • 本手法は、通常の予測区間だけでなく、連結していない予測集合も生成できるため、ターゲットのダイナミクスにおける分岐のような振る舞いの検出や表現が可能になる。
  • 理論結果として、正則性条件のもとでの漸近的に保証されたカバレッジが示され、さらに、正しい密度モデルの指定および/または適切にモデル化された非線形自己回帰スコア構造に基づく「二重ロバスト」性が示される。
  • シミュレーションおよび実データセット(Old Faithful、オーストラリアの電力使用量)に対する実験では、既存手法と比べて経験的カバレッジと集合サイズの情報量が改善され、適用可能な場合にはより狭い、あるいは複数区間からなる集合が得られることが示される。

アブストラクト: 時系列データに対して、保証された漸近的な条件付きカバレッジ率を実現する新しい確率的予測(conformal prediction)手法を提案します。Sequential Conformalized Density Regions(SCDR)では、予測区間と非連結の予測集合の両方を生成できるほど柔軟であり、分岐(bifurcations)の出現を示します。提案手法では、既存の推定された条件付き高密度予測領域を用いて初期の予測領域を構成します。その後、分位点ランダムフォレストによるconformal調整を行い、保証されたカバレッジを提供しつつ、時系列データの非交換可能性(non-exchangeable)を考慮するために適応的に変更します。
本手法は、ある種の正則性条件のもとで、提案手法が漸近的に保証されたカバレッジ率を達成することを示します。特に、この手法は二重頑健(doubly robust)です。つまり、予測密度モデルが正しく特定されている場合、そして/またはスコアが、正しく指定された次数をもつ非線形自己回帰モデルに従っている場合に機能します。
シミュレーションにより、本手法が経験的カバレッジ率と集合サイズの観点で既存手法を上回ることが明らかになります。さらに、2つの実データセットを用いて本手法を説明します。Old Faithful の噴火(geyser eruption)データセットと、オーストラリアの電力使用(electricity usage)データセットです。SCDRで形成した予測集合は、ガイザーの噴火継続時間について、単一の区間と2つの区間の和集合の両方を含みます。一方、既存の手法は、より広いものの情報量の少ない単一区間の予測集合しか生成しません。