自己正規化マルチンゲールと線形回帰における一様レグレットの上界

arXiv stat.ML / 2026/5/5

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、オンライン最小二乗法の信頼楕円体などで用いられる自己正規化マルチンゲール不等式を扱い、従来の上界が有界な共分散（共変量）や明示的な正則化行列の仮定のために真にスケール不変になっていない点を明らかにします。
追加仮定なしに非自明なスケール不変の自己正規化上界が成立できるのは1次元（d=1）のみで、d=1では共変量への制約なしにO(log T)のスケール不変上界が得られることを証明します。
一方、より高い次元（d>1）では、一般性を保ったままでは非自明なスケール不変上界は成り立たないことを示し、基礎的な不可能性を確立します。
この次元ごとの分岐を、オンライン線形回帰における「二重一様」レグレット（共変量スケールと比較（コンパレーター）ノルムの両方に依存しないレグレット）に結び付け、ALT 2019の未解決問題を解決します：d=1ではO(log T)の二重一様レグレットが可能であるのに対し、d>1では劣線形の二重一様レグレットは不可能です。
さらに、条件付き共変量分布のラドン・ニコディム導関数が（固定された基準測度に対して）有界であるという自然なスムーズ性仮定の下では、d>1でも劣線形レグレットを回復し、通常の正則化ペナルティなしで適応的な非i.i.d.ベクトル・マルチンゲールに対するスケール不変な自己正規化濃度不等式を導出します。

Abstract

自己正規化マルチンゲール不等式は、オンライン最小二乗法に対する信頼楕円体、そしてより広く多くのバンディットおよび強化学習の結果の核心にあります。にもかかわらず、既存のベクトル版およびスカラー版の結果は典型的には、共変量が有界であることと、明示的な正則化行列に依存しており、そのため得られる境界は \\emph{スケール不変ではない} ものになっています。自己正規化量自体は定義によりスケール不変ですが、その標準的な上界はそうではないのです。本論文では、自己正規化マルチンゲールに対してスケール不変な上界が可能となる条件を特徴づけます。追加の仮定なしに、非自明なスケール不変上界が存在し得るのは次元

d=1

のみであることを証明します。さらに

d=1

においては、共変量に関する何らの仮定も置かずに、

O(\log T)

のスケール不変な自己正規化境界を得ます。対照的に、

d>1

では、全ての場合において成り立つ非自明なスケール不変上界は存在し得ないことを示します。次に、この二分法をオンライン線形回帰における \\emph{二重一様} regret（すなわち、共変量のスケールと比較対象のノルムの双方に独立な regret 境界）に結びつけ、Gaillard, Gerchinovitz, Huard, Stoltz による未解決問題、 \\emph{``二乗損失を用いる逐次線形回帰問題に対する

\mathbb{R}^d

上での一様 regret 境界''}（ALT 2019）を解決します。すなわち

d=1

では、

O(\log T)

の二重一様 regret を達成する明示的なアルゴリズムを提示します。一方

d>1

では、従属次元が正である二重一様 regret を準線形にはできず不可能です。最後に、自然な \\emph{滑らかさ} 条件（固定された基準測度に関する条件付き共変量分布の Radon--Nikodym 微分が有界）を仮定すると、共変量が有界でない場合でも

d>1

に対して準線形 regret を回復し、通常の正則化ペナルティを伴わない自己正規化集中不等式を導きます。これは、おそらく適応的で非 i.i.d. なベクトル・マルチンゲールに対する初めての自然なスケール不変な境界であると言えます。

💡 この記事が使われたインサイト

AIの最新ニュースをまとめた「今日の要点」で、この記事が取り上げられています。

📅 5/5Dailyインサイトを見る →

小売のチャージバック回収はAgentHansaの“本当のPMF”になり得る理由

Dev.to

B2Bの売上回復（控除・短納入）ケース業務がAgentHansaの初期PMFとして最有力に見える理由

Dev.to

2026年にAIが「見えない毎日の相棒」になった10の方法

Dev.to

深夜2時にボトリングラインが停止したとき、勝つのは適切な交換部品を見つけるエージェント

Dev.to

「ビジー」ボタンはチャット窓だった：8時間の仕分けとブロッコリーの詩

Dev.to

自己正規化マルチンゲールと線形回帰における一様レグレットの上界

要点

Abstract

💡 この記事が使われたインサイト

関連記事

小売のチャージバック回収はAgentHansaの“本当のPMF”になり得る理由

B2Bの売上回復（控除・短納入）ケース業務がAgentHansaの初期PMFとして最有力に見える理由

2026年にAIが「見えない毎日の相棒」になった10の方法

深夜2時にボトリングラインが停止したとき、勝つのは適切な交換部品を見つけるエージェント

「ビジー」ボタンはチャット窓だった：8時間の仕分けとブロッコリーの詩

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer