因果推論におけるPrior-Data Fitted Networksの頻度主義的一貫性
arXiv cs.LG / 2026/3/13
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 因果推論に用いられるPFNは、ベイズ的なATE推定量として解釈した場合に事前情報に起因する交絡バイアスを生じる可能性があり、頻度主義的一致性を妨げる。
- 本論文では、頻度主義的一致性を回復するためのワンステップ後方補正(OSPC)キャリブレーションを提案し、キャリブレーションされたPFNに対して半パラメトリック Bernstein-von Mises 定理を導出する。
- PFNの上にマルティンゲール後方分布を適合させることでOSPCを実装し、キャリブレーションに必要な機能的ノイズ後方分布をPFNから回復する。
- (半)合成実験では、キャリブレーションされたPFNはATE不確実性を漸近的に頻度主義的不確実性と一致させ、有限サンプルにおいて他のベイズATE推定量と比較して適切に校正されている。
Prior-Data Fitted Networks(PFNs)に基づく基盤モデルは、文脈内学習問題としてタスクを位置づけることで因果推論において強力な経験的性能を示してきた。しかし、PFNベースの因果推定量が古典的な頻度主義推定量と一致する不確実性量化を提供するかどうかは明らかではない。本研究では、このギャップを埋めるべく、平均処置効果(ATE)に対するPFNベースの推定量の頻度主義的一致性を分析する。 (1) 既存のPFNは、ベイズ的なATE推定量として解釈すると事前情報に起因する交絡バイアスを生じうることを示す。すなわち、データによって事前が漸近的に上書きされないため、頻度主義的一致性を妨げる。 (2) 解決策として、ワンステップ後方補正(OSPC)に基づくキャリブレーション手続きを提案する。OSPCは頻度主義的一致性を回復するのに役立ち、キャリブレーションされたPFNに対して半パラメトリック Bernstein-von Mises 定理をもたらすことができる(すなわち、キャリブレーションされたPFNベースの推定量と古典的な半パラメトリック効率推定量が、データサイズの増大に伴って分布収束する)。 (3) 最後に、OSPCを、PFNの上にマルティンゲール後方分布を適合させることで実装する。これにより、OSPCに必要な機能的ノイズ後方分布をPFNから回復することができる。複数の(半)合成実験において、私たちのマルティンゲール後方分布OSPCでキャリブレーションされたPFNは、ATE不確実性を (i) 漸近的に頻度主義的不確実性と一致させ、(ii) 有限サンプルでは他のベイズATE推定量と比較して適切に校正されている。