強化学習を用いた時系列予測モデルのファインチューニング

arXiv cs.LG / 2026/3/23

📰 ニュースTools & Practical UsageModels & Research

共有:

要点

本論文は、金融の時系列予測モデルをファインチューニングするために用いられる3つの強化学習アルゴリズムを検討している。
強化学習タスクからの損失を、教師あり学習で最初に訓練されたモデルへバックプロパゲーションして、エンドツーエンドのファインチューニングを実現する計画を提案している。
ファインチューニングが予測性能を改善し、モデルに転移学習の特性が現れることを報告しており、この手法の利点を強調している。
調整プロセスの概要を示し、将来の実装を担う実務者を導くことを目的とした経験的結果を提供している。

要旨: 本章では、金融予測モデルの微調整に用いられる3つの主要な強化学習アルゴリズムを紹介します。強化学習タスクの損失を、教師あり学習で訓練されたモデルへ逆伝搬させるための明確な実装計画を提案し、微調整前後の性能を比較します。微調整後の性能が向上し、モデルに転移学習の特性が現れることを示し、微調整の利点を示します。また、実務者による今後の実装のための調整プロセスと実証的な結果を強調します。