善き点・悪しき点・サンプリング:安全なオンライン分類のためのノーリグレット手法

arXiv stat.ML / 2026/5/5

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、リスクが未知のロジスティックモデルに従う状況で、安全なオンライン2値分類を行うための逐次(ラウンドごとの)意思決定を扱います。
  • 各ラウンドで意思決定者は、真のラベルを得るために検査を購入するか、患者の特徴と過去データに基づいて転帰を予測するかを選び、誤分類率を目標αの下に(確率少なくとも1−δで)抑えることを目指します。
  • 著者らは、ロジスティックスコアに保守的なしきい値を用いて検査の要否を判断しつつ、ロジスティックパラメータと特徴分布を同時に推定する手法を提案します。
  • 手続きが高確率で誤差制約を満たすことを理論的に保証し、さらに「完全な知識を持つオラクル」と比べて必要な追加検査が~O(√T)にとどまるというノーリグレットなコストを示します。
  • シミュレーションにより、安全に患者を分類しつつパラメータ推定も効率的に行えることが確認され、医療スクリーニングへの直接的な応用可能性が述べられています。

Abstract

本研究では、リスクが未知のロジスティックモデルに従う場合の2値の疾病アウトカムに対する逐次検定を扱う。各ラウンドにおいて、意思決定者は、真のラベルを明らかにする検査に費用を払うか、患者の特徴量と過去データに基づいてアウトカムを予測するかを選択できる。目的は、誤分類率が確率少なくとも 1- \alpha 未満に保たれつつ、有用な検査コストを最小化することである。我々は、ロジスティックスコアに保守的なしきい値を用いて検査すべきタイミングを判断することで、ロジスティックパラメータ \theta^{\star} と特徴量分布を同時に推定する手法を提案する。本手続きが高い確率で目標誤差を達成し、完全な知識を持つオラクルに比べて必要となる追加検査数が O(\sqrt{T}) に抑えられることを証明する。これは、誤差制約付きロジスティック検定に対する初めての no-regret 保証であり、医療スクリーニングへの直接の応用がある。シミュレーションにより理論結果が裏付けられ、少数の追加検査で患者の安全な分類と \theta^{\star} の効率的な推定が達成されることが示される。