広告

Bayes-MICE:時系列データのための複数代入をベイズ流に行うアプローチ

arXiv stat.ML / 2026/3/31

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、時系列データに対する複数代入(Multiple Imputation by Chained Equations: MICE)のベイズ拡張である Bayes-MICE を提案し、MCMC によってモデルパラメータと代入(imputed)値の双方の不確実性を伝播させる。
  • 時系列に基づいた初期化と、時間遅れ(time-lagged)の特徴量を組み込むことで、時系列観測に内在する逐次的な依存関係をより適切に反映する。
  • AirQuality および PhysioNet データセットでの実験により、Bayes-MICE はベースライン手法と比べて、全変数において代入誤差を低減することが示される。
  • 著者らは、Metropolis-Adjusted Langevin Algorithm(MALA)が Random Walk Metropolis(RWM)よりも速く収束する一方で、同程度の精度を維持し、より一貫した事後分布の探索が得られることを見出している。
  • 全体として、この枠組みは、代入誤差を不確実性を考慮した指標として提供しつつ、精度を向上させる実用的で効率的な時系列代入手法として位置づけられている。

Abstract

時系列分析は、欠損データによってしばしば影響を受けますが、これは医療や環境モニタリングを含む複数の分野に共通する問題です。 連鎖方程式による多重代入(Multiple Imputation by Chained Equations; MICE)は、「完全条件付き指定(fully conditional specification)」によって欠損値を補完する手法として広く用いられてきました。私たちは、ベイズ的枠組み(Bayesian framework)を用いてMICEを拡張し、MICEモデルのパラメータと補完値の不確実性を考慮するために、マルコフ連鎖モンテカルロ(MCMC)サンプリングを通じてベイズ推論を用いて欠損値を補完するBayes-MICEを提案します。さらに、時系列データの逐次性を尊重するために、時間的に情報を含んだ初期化と、時間ラグ付きの特徴量をモデルに組み込みます。私たちは、2つの実データセット(AirQualityとPhysioNet)を用いて、またRandom Walk Metropolis(RWM)とMetropolis-Adjusted Langevin Algorithm(MALA)の両方のサンプラーを用いて、Bayes-MICE手法を評価します。その結果、Bayes-MICEは、すべての変数にわたってベースライン手法に比べて補完誤差を低減し、補完プロセスにおける不確実性も考慮するため、より正確な補完誤差の指標を提供できることが示されました。加えて、MALAはRWMよりも速く収束し、同等の精度を達成しつつ、より一貫した事後分布の探索を提供することも分かりました。総合すると、これらの知見は、Bayes-MICEの枠組みが、さまざまな環境・臨床の状況において、不確実性を意味のある形で定量化しながら精度を高めるというバランスを取りつつ、時系列補完のための実用的かつ効率的なアプローチであることを示唆しています。

広告