ストリーミング継続学習における時間的タスク化:評価不安定性の一要因
arXiv cs.LG / 2026/4/24
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- ストリーミング継続学習のベンチマークでは、連続ストリームを離散タスクへ分割する「時間的タスク化」が一般的だが、本研究はそれが中立な前処理ではなく、評価の構造的要素であると主張している。
- 著者らは、可塑性・安定性プロファイル、プロファイル間距離、Boundary-Profile Sensitivity(BPS)などを含むタスク化レベルの枠組みを提案し、モデル学習前に誘導されるレジームが境界の小さな摂動にどれほど敏感かを定量化する。
- ネットワークトラフィック予測(CESNET-Timeseries24)で、ストリーム・モデル・学習予算を固定しつつ時間的な分割(スプリット)のみを変えたところ、予測誤差、忘却、後方移転が大きく変化することを観察している。
- 短いタスク化ほど、分布レベルでのノイズが増え、構造的距離が大きくなり、境界への感度(BPS)が高くなるため、評価設定の違いによってベンチマーク結果が大きく揺れ得ることが示される。
- 本研究は、ストリーミング継続学習におけるベンチマークの結論は学習者とストリームだけでなく、そのストリームをどうタスク化するかにも依存すると結論づけており、「時間的タスク化」を評価の主要変数として扱うべきだと提案している。



