Abstract
時系列データ拡張は、データが限られることによって深層学習モデルの性能が制約される、回帰指向の予測タスクにおいて重要な役割を果たします。生成敵対ネットワーク(GAN)は合成時系列の生成において有望であることが示されていますが、既存の手法は主に周辺(marginal)データ分布の一致に焦点を当てるものであり、元の多変量時系列に自然に存在する時間的ダイナミクスを見落としがちです。多変量時系列を生成する際、この不一致は分布シフトと時間的ドリフトを引き起こし、それによって合成系列の忠実度が低下します。
本研究では、合成時系列における分布シフトを緩和し、時間的ダイナミクスを保持するための、モデル非依存のマルコフ連鎖モンテカルロ(MCMC)ベースの枠組みを提案します。条件付き生成モデルが逐次生成の過程でどのように偏差を蓄積するのかを理論的に分析し、MCMCアルゴリズムが、隣接する時点間の経験的な遷移統計と整合することを強制することで、これらの不一致を補正できることを示します。
RCGAN、GCWGAN、TimeGAN、SigCWGAN、AECGANを用いたローレンツ(Lorenz)、リコール(Licor)、ETTh、ILIデータセットに関する大規模な実験により、提案するMCMCフレームワークが、自己相関の整合、歪度誤差、尖度誤差、R^2、弁別スコア、予測スコアのいずれにおいても一貫して改善をもたらすことが示されます。これらの結果は、敵対的な分布マッチングのみに依存するのではなく、元データと整合する合成時系列を得るには、遷移則を明示的に保持する必要があることを示唆しており、時系列データの生成モデリングを改善するための原理的な方向性を提供するものです。