ストリーミング継続学習における時間的タスク化：評価不安定性の一要因

arXiv cs.LG / 2026/4/24

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

ストリーミング継続学習のベンチマークでは、連続ストリームを離散タスクへ分割する「時間的タスク化」が一般的だが、本研究はそれが中立な前処理ではなく、評価の構造的要素であると主張している。
著者らは、可塑性・安定性プロファイル、プロファイル間距離、Boundary-Profile Sensitivity（BPS）などを含むタスク化レベルの枠組みを提案し、モデル学習前に誘導されるレジームが境界の小さな摂動にどれほど敏感かを定量化する。
ネットワークトラフィック予測（CESNET-Timeseries24）で、ストリーム・モデル・学習予算を固定しつつ時間的な分割（スプリット）のみを変えたところ、予測誤差、忘却、後方移転が大きく変化することを観察している。
短いタスク化ほど、分布レベルでのノイズが増え、構造的距離が大きくなり、境界への感度（BPS）が高くなるため、評価設定の違いによってベンチマーク結果が大きく揺れ得ることが示される。
本研究は、ストリーミング継続学習におけるベンチマークの結論は学習者とストリームだけでなく、そのストリームをどうタスク化するかにも依存すると結論づけており、「時間的タスク化」を評価の主要変数として扱うべきだと提案している。

Dev.to

Dev.to

Dev.to

Dev.to

Reddit r/LocalLLaMA