能動的逐次予測に基づく平均推定の再検討

arXiv stat.ML / 2026/4/21

📰 ニュースModels & Research

要点

  • 本論文は、各ラウンドで共変量を観測した上で真のラベルを問い合わせる確率を決め、問い合わせない場合は機械学習モデルの予測を用いる能動的逐次予測–に基づく平均推定を再検討する。
  • 先行研究で提案された「不確実性に基づく問い合わせ提案」と「一定確率のソフト制約」を混合する手法を調べ、経験的に最小の信頼区間幅が“一定確率成分の重みがほぼ1に近い”ときに現れやすいことを示す。
  • 推定量に対する信頼区間のデータ依存の上界を与える、非漸近的な理論解析を新たに提示する。
  • さらに、問い合わせ確率の決定にno-regret学習を用いると、問い合わせ確率は(現在の共変量に依存しない形で選ばれる場合に)問い合わせ確率の最大制約へ収束することを示唆する。
  • シミュレーションにより、理論的な知見と経験的観察の整合性が検証される。

要旨: 本研究では、能動的逐次予測による平均推定の問題を再検討する。各ラウンドにおいて、サンプルの共変量を観測した後、真のラベルの問い合わせ確率を決定しなければならない。さらに、ラベルが問い合わせられない場合には、機械学習モデルの予測が代わりに用いられる。先行研究では、問い合わせ確率を、不確実性に基づく提案と、問い合わせ確率へのソフトな制約を符号化する一定確率とを組み合わせることで決定する、優れた方式が提案された。我々は混合パラメータの異なる値を検討し、興味深い経験的パターンを観察した。不確実性に基づく成分の影響を小さくするため、一定確率への重みが1に近いときに、最小の信頼区間の幅が生じる傾向があることが分かった。この観察に動機づけられて、推定量の非漸近的解析を開発し、その信頼区間に対するデータ依存の上界を確立する。さらに本解析は、問い合わせ確率を決定しこの上界を制御するためにノーリグレット学習のアプローチを用いると、問い合わせ確率は、現在の共変量に対して無自覚に選ばれたとき、その問い合わせ確率の最大値の制約へ収束することを示唆している。我々はまた、これらの理論的知見を裏付けるシミュレーションも実施した。