OCRR:分布シフト下におけるオンライン修正リカバリのためのベンチマーク
arXiv cs.LG / 2026/5/6
📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research
要点
- この論文は、データ分布の変化(新カテゴリ、言い換えクエリ、ドリフトなど)に直面した際に、ユーザーの修正を通じて分類システムがどれだけオンラインで回復できるかを評価する新しいベンチマーク「OCRR」を提案します。
- OCRRは、コーパスをストリーミングし、オラクルまたは確率的な修正ポリシーを適用しながら評価し、修正回数に応じて「新カテゴリの精度」と「元の分布における精度」の2つの性能曲線を出します。
- Banking77およびCLINC150での実験では、提案手法(substrate)が、等しいメモリ予算の条件で、次点の既存の継続学習ベースラインを32.6ポイント上回りつつ、新カテゴリ回復(88.7% ± 2.9%)と元分布の保持(95.4% ± 0.8%)の双方を同時に満たす点が示されています。
- さらに、近似最近傍検索の品質が大きく低下しても(recall@5が10k〜10Mのスケールで0.69から0.23へ劣化)、分類精度は約99%で安定しており、トップk recall指標では予測できない頑健性があることを報告しています。
- ベンチマークのコードとデータはGitHubで公開されており、オンライン修正リカバリ手法の比較・検証が可能になります。




