時系列基盤モデル vs LLM:日本株5日間予測ベンチマーク(N=100)
Zenn / 4/15/2026
💬 OpinionIdeas & Deep AnalysisModels & Research
Key Points
- 時系列基盤モデル(時系列専用の基盤モデル)と一般的なLLMを、日本株の5日間予測タスクで比較するベンチマークが提示されています(サンプル数N=100)。
- 予測性能を「同じ条件で」比べることで、時系列データに対する適合度が時系列基盤モデル側で優位になり得る点を検証する趣旨です。
- LLMは汎用性が高い一方で、株価などの時系列特性に対して設計上の前提がどこまで効くかが論点になります。
- 本記事はモデル選定の判断材料として、時系列予測領域での“LLMを使うべきか/時系列基盤モデルが妥当か”をデータに基づき検討する内容です。
時系列基盤モデル vs LLM:日本株5日間予測ベンチマーク(N=100)
はじめに
「時系列専用の基盤モデル(Kronos)と、大規模言語モデル(Claude Sonnet/Opus)を日本株の短期予測に使ったらどちらが強いのか?」
この素朴な疑問を、100日間・10銘柄のバックテストで検証しました。単純な方向性予測精度だけでなく、実際の取引コストを考慮したロング・ショート戦略のシャープレシオまで計測した結果、LLM(特にClaude Opus)が時系列専用モデルに対して明確な優位性を示すという、やや意外な結論が得られました。
検証概要
モデル
モデル
種別
特...
Continue reading this article on the original site.
Read original →Related Articles
Are gamers being used as free labeling labor? The rise of "Simulators" that look like AI training grounds [D]
Reddit r/MachineLearning

Big Tech firms are accelerating AI investments and integration, while regulators and companies focus on safety and responsible adoption.
Dev.to

Big Tech firms are accelerating AI investments and integration, while regulators and companies focus on safety and responsible adoption.
Dev.to
Failure to Reproduce Modern Paper Claims [D]
Reddit r/MachineLearning
Why don’t they just use Mythos to fix all the bugs in Claude Code?
Reddit r/LocalLLaMA