バッチ適応型因果注釈

arXiv stat.ML / 2026/4/21

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、政策や意思決定で重要となる因果効果の推定において、アウトカムが欠損していたり非標準の計測誤差が含まれたりする状況で、効率よく推定する手法を扱います。
欠損アウトカム下での二重ロバスト推定（AIPW/doubly robust）における漸近分散を最小化することで、どのデータ点をアウトカム情報としてラベル付け（注釈）すべきかを最適化するバッチサンプリング戦略を提案します。
最適なバッチサンプリング確率について閉形式の解を導出し、欠損アウトカムがある場合の平均処置効果（ATE）推定の効率を高めます。
医療やソーシャルサービスにおけるテキストや画像などの非構造データの高コスト注釈にも枠組みを拡張し、シミュレーションおよび実データ（ホームレス支援の街頭アウトリーチ介入を含む）で、既存ベースラインより平均二乗誤差が小さく、必要ラベル数が少ないことを示します。
実運用では、ランダムサンプル361件で得られる信頼区間を、最適化サンプル90件のみで再現でき、ラベリング予算を約75%節約できると述べています。