要旨: 欠測データの補完は、特に不確実性の定量化が不可欠である場合において、現代のデータサイエンスにおける基本的な課題として残っています。本研究では、Bayesian生成モデリングによるAI駆動の欠測データ補完手法であるMissBGMを提案します。MissBGMは、ニューラルネットワークの表現力の柔軟性と、ベイズ推論の統計的厳密さを橋渡しします。しばしば点推定に焦点を当てたり、欠測メカニズムを暗黙的に扱ったりする既存手法とは異なり、MissBGMはデータ生成メカニズムと欠測メカニズムを明示的かつ共同でモデル化し、単一の点推定ではなく、補完に関する原理的な事後不確実性を提供します。収束するまで、欠測値、モデルパラメータ、潜在変数の間で交互更新を行う確率的最適化の枠組みを開発します。理論的解析により、MissBGMから得られる欠測値の推定が、穏当な仮定のもとで一貫して収束することを示します。実験的に、広範な実験設定において、MissBGMが従来の補完手法および近年のニューラルネットワークベースの手法に比べて優れた性能を達成することを示します。これらの結果は、MissBGMを現代の欠測データ補完のための原理的かつスケーラブルな解決策として確立するものです。MissBGMのコードは https://github.com/liuq-lab/MissBGM でオープンソースとして公開されています。
AIによるベイズ生成モデリングを用いた欠損(Missingness)を考慮するデータ補完
arXiv stat.ML / 2026/5/5
📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research
要点
- 本論文では、欠損データ補完において事後の不確実性を提供し、単一の推定値ではない形で補完結果を得る「MissBGM」を提案する。
- MissBGMは、データ生成過程と欠損メカニズムの両方を明示的かつ同時にモデル化することで、欠損を暗黙に扱いがちな従来手法の限界に対処する。
- 欠損値・モデルパラメータ・潜在変数を交互に更新し、収束まで繰り返す確率的最適化手法を提示している。
- 理論解析では、軽い仮定の下で欠損値推定が一貫して収束することを示し、実験では従来手法や近年のニューラルネット系補完手法より優れた性能を報告している。
- MissBGMのコードはオープンソース化されており、実運用やさらなる研究への展開を後押しする。




